Decimal Floating Point Multiplier

An IEEE 7542008 Decimal Parallel and
Pipelined FPGA FloatingPoint Multiplier
Malte Baesler, SvenOle Voigt, Thomas Teufel
Institute for Reliable Computing
Hamburg University of Technology
September 1st, 2010
Agenda
1. Introduction
a)Why Decimal FloatingPoint Arithmetic?
b)What are the Requirements on the Decimal Multiplier?
2. Decimal FixedPoint Multiplier
3. Decimal FloatingPoint Multiplier
4. Post Place & Route Results
a)FixedPoint Multiplier
b)FloatingPoint Multiplier
M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

1/30
Introduction Decimal FixedPoint Multiplier Decimal FloatingPoint Multiplier Post Place & Route Results
Introduction

2/30
Why decimal floatingpoint arithmetic?
● avoid conversion errors
● human centric applications
● required for commercial applications, e.g. interest
calculation

2/30
Why decimal floatingpoint arithmetic?
● avoid conversion errors
● human centric applications
● required for commercial applications, e.g. interest
calculation
IEEE Standard 7542008 for FloatingPoint Arithmetic
● published in August 2008
● replaces IEEE 7541985 and IEEE 8541987
● binary and decimal floatingpoint arithmetic

2/30
FloatingPoint Arithmetic
IEEE 7542008 FloatingPoint Arithmetic
decimal64 data format
● radix b=10
● significand precision p=16
● exponent range q =398, qmax=369
min

3/30
Requirements on the multiplier
● fast
● low resource usage
● IEEE 7542008 compliant
● pipelined due to reuse in accurate scalar product
→ fully combinational
● optimized for FPGA architecture (Virtex5)
– internal fast carry chain
– DSP48E slices

4/30
Requirements on the multiplier
● fast
● low resource usage
● IEEE 7542008 compliant
● pipelined due to reuse in accurate scalar product
→ fully combinational
● optimized for FPGA architecture (Virtex5)
– internal fast carry chain
– DSP48E slices

4/30
Decimal FixedPoint Multiplier

5/30
FixedPoint Multiplier
How does multiplication work?
school method:
● partial product generation
● accumulation of partial products
1234⋅5678 = 5000⋅1234
 600⋅1234
 70⋅1234
 8⋅1234

5/30
● based on concepts of A. Vazquez, E. Antelo, P.Montuschi 1
● fully combinational
● BCD recoding schemes
● fast partial product generation
● fast BCD4221 carry save adder reduction tree
1
“A new family of highperformance parallel decimal multipliers“,
18th IEEE Symposium on Computer Arithmetic, June 2007
6/30
P0 BCD4221
SBCD8421
CPA
ABCD8421 P1 BCD4221
PPGen
CSAT
p digits 2p digits
...
DRec
BBCD8421 Pp+1 BCD4221
p digits 2p S_sBCD4221
2p S_wBCD4221
PPGen Partial Product Generator CSAT Carry Save Adder Tree
DRec Decimal Recoding Unit CPA Carry Propagation Adder

7/30
Decimal Recoding
P0 BCD4221
SBCD8421
CPA
ABCD8421 P1 BCD4221
PPGen
CSAT
p digits 2p digits
...
DRec
2p S_wBCD4221

8/30
Decimal Recoding
● transforms the multiplier's digit set into
{0, 9 } {−5,5 }
● reduces number of multiplicand multiples
 A×1, A×2, A×3, A×4, A×5
● very fast operation, no ripple carry

8/30
Partial Product Generator
P0 BCD4221
SBCD8421
CPA
ABCD8421 P1 BCD4221
PPGen
CSAT
p digits 2p digits
...
DRec
2p S_wBCD4221

9/30
Partial Product Generator
● calculates multiples  A×1, A×2, A×3, A×4, A×5

– exploits correlation between shift operation and constant
value multiplication
●  X 5421 ≪1= X⋅28421
●
 X 8421 ≪3= X⋅55421
– BCD Recoding is fast
– fixedvalue shift operation is for free
– only requires one carry propagate adder
A×3
0 p1
● generates partial products by selection of
P P
A×1− A×5
● 10's complement for B k 0 :− X n  X 0 = Xn  X0 1

9/30
BCD4221 Carry Save Adder Tree
P0 BCD4221
SBCD8421
CPA
ABCD8421 P1 BCD4221
PPGen
CSAT
p digits 2p digits
...
DRec
2p S_wBCD4221

10/30
Carry Save Adder Tree
carry save adder tree sums up p+1 partial products
P1
P2
P3
...
Pp+1

10/30
CSA tree with respect to decimal recoding
sign extension P1
sign extension P2 C1
sign extension P3 C2
...
Pp+1 Cp

10/30
improved CSA tree with respect to decimal recoding
P1
P2 C1
P3 C2
...
Pp+1 Cp
improved sign extension

10/30
Improved Sign Extension
● adding several words composed of leading nines and
following zeros always yields to a word composed of 0, 8,
and 9. For example 999999990000
 999900000000
 990000000000
= x989899990000
● position of 0, 8, and 9 can be calculated very fast by
means of FPGA's fast carry chain
{
9 for c ink =0∧sign k =1
X
NegDC
k
0 else
in
= 8 for c =1∧sign k =1
k
out
c =c
k
in
k1 =
{ 1 for sign k =1
c ink else

11/30
P0 BCD4221
SBCD8421
CPA
ABCD8421 P1 BCD4221
PPGen
CSAT
p digits 2p digits
...
DRec
2p S_wBCD4221

12/30
P0 BCD4221
SBCD8421
CPA
ABCD8421 P1 BCD4221
PPGen
CSAT
p digits 2p digits
...
DRec
2p S_wBCD4221

12/30
Decimal FloatingPoint Multiplier

13/30
● additional units for rounding, exponent computation and
data format encoding/decoding
● based on M. Erle, B. Hickmann, M.Schulte 2
● early estimation of shift left amount
● fully IEEE 7542008 compliant
● support for gradual underflow and all rounding modes
● adapted to FPGA technology
2
“Decimal FloatingPoint Multiplication“, IEEE Transaction on
Computers, VOL. 58, NO. 7, July 2009
13/30
Y X
X = 0x03C80000534B9C1E
Y = 0x0250000277CB0D10
Densily Packed Decimal (DPD) Decoder
Leading Zeros Count / Decimal FixedPoint
Shift Left Amount Multipliplier
Computation
Left Shift Register
Exponent Carry Propagate
Computation Adder
RoundUp Detection Overflow / Underflow Correction
Rounding Unit
Exception Unit DPD Encoder
exception signals X•Y

14/30
Y X
X = 0x03C80000534B9C1E
Y = 0x0250000277CB0D10
X = +0000001234567890 EXP156
Leading Zeros Count / Decimal FixedPoint Y = +0000009876543210 EXP250
Shift Left Amount Multipliplier X•Y = +12193263111263526900 EXP406
Computation
Left Shift Register
Computation Adder
Rounding Unit

15/30
Y X
X = +0000001234567890 EXP156
Y = +0000009876543210 EXP250
X•Y = +12193263111263526900 EXP406
Leading Zeros Count / Decimal FixedPoint Z = significand(X•Y)

Shift Left Amount Multipliplier Z = 00000000000012193263111263526900
Computation Zs = 66888846846688648888664609006600
Zc = 33111153153323544414446654520300
Left Shift Register
Computation Adder
Rounding Unit

16/30
Y X
X = +0000001234567890 EXP156
Y = +0000009876543210 EXP250
X•Y = +12193263111263526900 EXP406

Computation Zs = 66888846846688648888664609006600
Zc = 33111153153323544414446654520300
Left Shift Register
LZ(X)=6, LZ(Y)=6, SLA=min(6+6, p)=12
Z = 1219326311126352.690000000000000
Computation Adder Zs = 8864888866460900.660000000000000
Zc = 2354441444665452.030000000000000
Rounding Unit

17/30
Y X
X = +0000001234567890 EXP156
Y = +0000009876543210 EXP250
X•Y = +12193263111263526900 EXP406

Computation Zs = 66888846846688648888664609006600
Zc = 33111153153323544414446654520300
Left Shift Register
LZ(X)=6, LZ(Y)=6, SLA=min(6+6, p)=12
Z = 1219326311126352.690000000000000
Zc = 2354441444665452.030000000000000
Z' = 1219326311126352, G=6, R=9, sb='0'
Rounding Unit

18/30
Y X
X = +0000001234567890 EXP156
Y = +0000009876543210 EXP250
X•Y = +12193263111263526900 EXP406

Computation Zs = 66888846846688648888664609006600
Zc = 33111153153323544414446654520300
Left Shift Register
LZ(X)=6, LZ(Y)=6, SLA=min(6+6, p)=12
Z = 1219326311126352.690000000000000
Zc = 2354441444665452.030000000000000
Z' = 1219326311126352, G=6, R=9, sb='0'
exponent = 406 + p – SLA = 402
Rounding Unit

19/30
Y X
X = +0000001234567890 EXP156
Y = +0000009876543210 EXP250
X•Y = +12193263111263526900 EXP406

Computation Zs = 66888846846688648888664609006600
Zc = 33111153153323544414446654520300
Left Shift Register
LZ(X)=6, LZ(Y)=6, SLA=min(6+6, p)=12
Z = 1219326311126352.690000000000000
Zc = 2354441444665452.030000000000000
Z' = 1219326311126352, G=6, R=9, sb='0'
Rounding Unit
Z'' = 0000121932631112, G=6, R=3, sb='1'
exponent = 398

20/30
Y X
X = +0000001234567890 EXP156
Y = +0000009876543210 EXP250
X•Y = +12193263111263526900 EXP406

Computation Zs = 66888846846688648888664609006600
Zc = 33111153153323544414446654520300
Left Shift Register
LZ(X)=6, LZ(Y)=6, SLA=min(6+6, p)=12
Z = 1219326311126352.690000000000000
Zc = 2354441444665452.030000000000000
Z' = 1219326311126352, G=6, R=9, sb='0'
Rounding Unit
Z'' = 0000121932631112, G=6, R=3, sb='1'
exponent = 398
round up → Z''' = 0000121932631113 EXP398

21/30
Y X
X = +0000001234567890 EXP156
Y = +0000009876543210 EXP250
X•Y = +12193263111263526900 EXP406

Computation Zs = 66888846846688648888664609006600
Zc = 33111153153323544414446654520300
Left Shift Register
LZ(X)=6, LZ(Y)=6, SLA=min(6+6, p)=12
Z = 1219326311126352.690000000000000
Zc = 2354441444665452.030000000000000
Z' = 1219326311126352, G=6, R=9, sb='0'
Rounding Unit
Z'' = 0000121932631112, G=6, R=3, sb='1'
exponent = 398
round up → Z''' = 0000121932631113 EXP398
Z = 0x000000285BCCC493
invalid inexact overflow underflow
22/30
type1 type2 type3

fixedpoint redundant redundant
nonredundant
multiplier output (delayed CPA) (delayed CPA)
CPA length (digits) p+2 = 18 p+2 = 18 2·p = 32
shift register multiplier based multiplexer based multiplexer based
decimal fixedpoint multiplier decimal fixedpoint multiplier
Ps Pc Ps Pc
shift register shift register CPA (2·p)
Qsu Qsl Qcu Qcl
CPA (p+2) CPA (p2) shift register

... ...
OR OR
product GR sticky bit product GR sticky bit
23/30
type1 type2 type3

nonredundant
Ps Pc Ps Pc
Qsu Qsl Qcu Qcl

... ...
OR OR
23/30
type1 type2 type3

nonredundant
Ps Pc Ps Pc
Qsu Qsl Qcu Qcl

... ...
OR OR
23/30
type1 type2 type3

nonredundant
shifting through multiplication: X(31:16) X(15:0)

shift 2k
n
● X ≪ n ≡ X⋅2
● requires two DSP48Es MUL MUL
per 32bit shift
DSP48E
saves LUTs DSP48E
●
ADD
Y(31:16) Y(15:0)

24/30
Post Place & Route Results

25/30
Decimal FixedPoint Multiplier with CPA output
● Xilinx Virtex5, speed grade 2
● up to 13 pipeline registers, configurable via VHDL generics
● 5350 – 6500 LUTs, 0 – 4900 FFs
● 5500 – 7600 combined LUTs and FFs
25/30
Decimal FixedPoint Multiplier with CPA output
● Xilinx Virtex5, speed grade 2
● up to 13 pipeline registers, configurable via VHDL generics
● 5350 – 6500 LUTs, 0 – 4900 FFs
● 5350 – 7600 combined LUTs and FFs
25/30

26/30

27/30
Type1 Type2 Type3
mulbased shifting, muxbased shifting, muxbased shifting,
delayed CPA delayed CPA no delayed CPA
#LUTs 6300 8400 7900 9400 7500 9400
#FFs 0 4100 0 4500 0 4400
#(LUT + FFs) 6500 8400 8300 9300 7600 9600
#DSP48E 17 0 0
● approx. 70% of the LUTs are used by the fixedpoint
multiplier (for Type2 and Type3)
● medium Virtex5 XC5VLX110T:
80009000 LUTs ~ 11.5%13%

28/30
Comparison to binary floatingpoint multiplier
● 64 bit binary floatingpoint multiplier generated with CoreGen
● no DSP48E
● Type2 decimal vs. CoreGen binary multiplier
decimal binary decimal binary
max. frequency (MHz)
10000 400
number of LUTs
300
5000 200
100
0 0
0 3 6 9 0 3 6 9
number of pipeline registers number of pipeline registers
decimal mult. : 3.2 – 3.5 more LUTs binary mult. : 1.6 – 2.2 times faster

29/30
Comparison to binary floatingpoint multiplier
● 64 bit binary floatingpoint multiplier generated with CoreGen
● no DSP48E
● Type2 decimal vs. CoreGen binary multiplier
decimal binary decimal binary
max. frequency (MHz)
10000 400
number of LUTs
300
5000 200
100
0 0
0 3 6 9 0 3 6 9
number of pipeline registers number of pipeline registers
decimal mult. : 3.2 – 3.5 more LUTs binary mult. : 1.6 – 2.2 times faster

29/30
Summary
● decimal fixedpoint multiplier
– parallel, fully combinational
– configurable number of pipeline stages
● decimal floatingpoint multiplier
– configurable number of pipeline stages
– three different implementations
– tradeoff: area vs. speed
● future work: fully IEEE 7542008 compliant coprocessor

30/30
Thank you for your attention!!!

Decimal Floating Point Multiplier

Uploaded by

Document Information

Original Description:

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Decimal Floating Point Multiplier

Uploaded by

Copyright:

Available Formats

An IEEE 754­2008 Decimal Parallel and

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

● calculates multiples  A×1, A×2, A×3, A×4, A×5

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

Leading Zeros Count / Decimal Fixed­Point Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

Leading Zeros Count / Decimal Fixed­Point Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

Leading Zeros Count / Decimal Fixed­Point Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

Leading Zeros Count / Decimal Fixed­Point Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

Leading Zeros Count / Decimal Fixed­Point Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

Leading Zeros Count / Decimal Fixed­Point Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

Leading Zeros Count / Decimal Fixed­Point Z = significand(X•Y)

type1 type2 type3

CPA (p+2) CPA (p­2) shift register

type1 type2 type3

CPA (p+2) CPA (p­2) shift register

type1 type2 type3

CPA (p+2) CPA (p­2) shift register

type1 type2 type3

shifting through multiplication: X(31:16) X(15:0)

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal Floating­Point Multiplier 09/01/2010

You might also like

An IEEE 7542008 Decimal Parallel and

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

Leading Zeros Count / Decimal FixedPoint Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

Leading Zeros Count / Decimal FixedPoint Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

Leading Zeros Count / Decimal FixedPoint Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

Leading Zeros Count / Decimal FixedPoint Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

Leading Zeros Count / Decimal FixedPoint Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

Leading Zeros Count / Decimal FixedPoint Z = significand(X•Y)

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

Leading Zeros Count / Decimal FixedPoint Z = significand(X•Y)

CPA (p+2) CPA (p2) shift register

CPA (p+2) CPA (p2) shift register

CPA (p+2) CPA (p2) shift register

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010

M. Baesler, S. Voigt, T. Teufel Decimal FloatingPoint Multiplier 09/01/2010