Tilbake til søkeresultatene

IKTPLUSS-IKT og digital innovasjon

Balancing Compute and Memory Performance in Reconfigurable Accelerators with Analytical Modeling

Alternativ tittel: Balansert beregningsytelse og minneytelse i rekonfigurerbare akseleratorer

Tildelt: kr 7,7 mill.

Den eksponentielle økningen av datamaskinytelse over de siste fire tiårene har vært et resultat av kontinuerlig forbedring av produksjonsteknologi. Dennardskalering, som beskriver hvordan spenningene og dimensjonene på transistorene kan endres slik at man får mindre transistorer som bruker mindre strøm, har vært kritisk for å få til denne ytelsesforbedringen. Med Dennardskalering kan man doble antallet transistorer på en brikke mellom hver teknologigenerasjon mens effektforbruket holdes konstant. Dermed danner Dennardskalering grunnlaget for den mer kjente ytelsestrenden Moores lov. I moderne produksjonsprosesser fører Dennardskalering til økt effektforbruk fordi reduksjon av transistorenes terskelspenning medfører eksponentielt økende statisk effektforbruk. Samtidig har vi nådd grensen for det effektforbruket et praktisk realiserbart kjølesystem kan håndtere. Dette medfører at dagens høyytelsesdatamaskiner primært er begrenset av effektforbruket. Dermed blir teknikker som utnytter parallellitet, som for eksempel energieffektive akselleratorer, nødvendige for videre forbedring av ytelse -- en nødvendighet i viktige domener som klimamodellering, persontilpasset medisin, materialforskning, kjemi og nanoteknologi. I BAMPAM vil vi redusere effektforbruket til tett koblede rekonfigurerbare akseleratorer gjennom å formulere analytiske modeller som gjør det mulig å automatisk generere akseleratorinstanser med balansert minneytelse og beregningsytelse. En balansert akselerator aktiverer kun de beregningsenhetene som minnesystemet kan støtte -- for å maksimere ytelse -- og skrur av de resterende enhetene -- for å redusere effektforbruket.

BAMPAM will improve the power-efficiency of tightly integrated reconfigurable accelerators by formulating analytical performance models that enable automatically generating accelerator instances with balanced compute and memory performance. Current high-performance computers are power-limited, and leveraging parallelism, for instance in the form of power-efficient accelerators, is necessary to further improve their performance -- a critical requirement across important domains such as climate modeling, personalized medicine, materials science, chemistry, nanotechnology, automotive and energy. In BAMPAM, we focus on processors with tightly coupled reconfigurable accelerators. These accelerators consist of a grid of compute units that can be configured to create specialized hardware for performance-critical application code regions. Accelerator imbalance is caused by activating more compute units than the system's memory configuration can support and results in poor power-efficiency because compute units needlessly dissipate power while waiting for memory. A balanced accelerator activates exactly the number of compute units the memory configuration can support - to ensure high performance - while disabling remaining units - to save power. The key research challenge is to devise approaches that automatically determine the number of compute units that achieve balance for different applications. We propose to overcome this challenge by formulating and validating analytical performance models that enable identifying the point of balance based on key application characteristics. These models will enable us to investigate model-based approaches for automatically generating balanced application-specific accelerator instances and thereby discover novel accelerator architectures or novel accelerator generation algorithms.

Publikasjoner hentet fra Cristin

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Ingen publikasjoner funnet

Budsjettformål:

IKTPLUSS-IKT og digital innovasjon