会议

现场可编程定制计算机

内容:现场可编程自定义计算机是一个学术会议。会议主要发表在:现场可编程门阵列和可重构计算。在整个生命周期中,会议共发表了1391篇出版物,获得了36687次引用。
论文
多个过滤器

学报的文章 DOI
杰伊·豪泽 1约翰Wawrzynek 1 机构(1
1997年4月16日 -
TL;博士:提出了Garp体系结构的新方面,以及一个原型软件环境和初步性能结果,这表明,对于一些有用的应用,类似技术的Garp可以实现从因子2到高达因子24的加速。
文摘:典型的可重构机器存在一些缺点,使它们不太适合通用计算。Garp体系结构将可重构硬件与同一模具上的标准MIPS处理器相结合,以保留两者的更好功能。提出了该体系结构的新颖方面,以及一个原型软件环境和初步性能结果。与UltraSPARC相比,类似技术的Garp在一些有用的应用中可以实现从2倍到24倍的加速。

1020年引用


学报的文章 DOI
2001年4月29日( -
TL;博士:一种利用fpga的非确定性有限自动机在给定文本中找到与给定正则表达式匹配的有效方法,这是在可编程逻辑上第一次实际使用非确定性状态机。
文摘:本文提出了一种利用fpga在给定文本中查找与给定正则表达式的匹配的有效方法。为了匹配长度为n的正则表达式,串行机器需要0(2^n)内存,每个文本字符花费0(1)时间。所提出的方法只需要0(n^2)个空间,并且仍然在0(1)个时间(一个时钟周期)内处理一个文本字符。这种改进是由于使用了非确定性有限自动机(NFA)来执行匹配。据作者所知,这是第一次在可编程逻辑上实际使用非确定性状态机。此外,本文还提出了一种简单、快速的算法,可快速构建给定正则表达式的NFA。快速NFA构造是至关重要的,因为NFA结构依赖于正则表达式,而正则表达式只有在运行时才知道。介绍了该算法在传统fpga和自重构门阵列(SRGA)上的实现。为了评估性能,NFA逻辑被映射到Virtex XCV100 FPGA和SRGA上。此外,在一台800 MHz的奔腾III机器上评估了GNU grep匹配正则表达式的性能。在大多数情况下,所提出的方法比最佳grep性能要快。 It was orders of magnitude faster than worst case grep performance. Logic for the largest NFA considered fit in less than a 1000 CLBs while DFA storage for grep in the worst case consumed a few hundred megabytes.

644引用


学报的文章 DOI
1997年4月16日 -
TL;博士:描述了时间复用FPGA的体系结构,它包括处理状态保存和转发以及由于硬件时间复用而增加的路由需求的扩展。
文摘:介绍了一种时间复用FPGA的结构。FPGA的八种配置存储在片上存储器中。这种非激活的片上存储器分布在芯片周围,并且可访问,因此FPGA的整个配置可以在存储器的单个周期内更改。FPGA的整个配置可以在30纳秒内从片上存储器加载。非激活内存可作为应用程序的块RAM访问。该FPGA基于Xilinx XC4000E FPGA,包括处理状态保存和转发以及由于硬件时间多路复用而增加的路由需求的扩展。

530引用


学报的文章
1996年1月01 -
文摘:MATRIX是一种新的、粗粒度的、可重构的计算体系结构,它支持可配置的指令分布。设备资源分配用于控制和描述每个任务的计算。特定于应用程序的规则允许我们压缩分配给指令控制和分配的资源,在许多情况下为数据路径和计算产生更多的资源。这种适应性是通过多级配置方案、支持数据路径和指令分布的统一可配置网络和可作为指令存储、内存元素或计算元素的粗粒度构建块实现的。在0.5 ~ CMOS工艺中,位于MATRIX架构核心的8位功能单元的占地面积约为1.5mmx 1.2mm,使单模具有超过100个功能单元成为现实。在这个过程点上,IOOMHz操作很容易实现,允许MATRIX组件以10 Goph(8位操作)的顺序交付。

466引用


学报的文章 DOI
1997年4月16日 -
TL;博士:本文描述了Chimaera,该系统通过将可重构逻辑集成到主机处理器本身来克服通信瓶颈,并允许创建多操作数指令和推测执行模型,这是高性能、通用的重新配置计算的关键。
文摘:通过将可重构逻辑与主机处理器严格分离,目前的定制计算系统面临着严重的通信瓶颈。在本文中,我们描述了Chimaera,该系统通过将可重构逻辑集成到主机处理器本身,并直接访问主机处理器的寄存器文件,从而克服了这一瓶颈,该系统支持创建多操作数指令和推测执行模型,这是高性能、通用可重构计算的关键。它还支持多输出函数,并利用部分运行时重新配置来减少重新配置时间。综合起来,该系统可以为通用计算提供2倍或更多的加速,而手动映射应用程序则可以提供160倍或更多的加速。

446引用


网络信息
相关会议(5)
高性能计算机体系结构

1.1 k论文70.4 k引用

87%相关
国际并行与分布式处理研讨会

7.8 k论文137 k引用

87%相关
欧洲的设计、自动化和测试

7.4 k论文142.8 k引用

86%相关
低功耗电子与设计国际研讨会“,

1.9 k论文56.2 k引用

84%相关
微建筑国际研讨会

1.9 k论文112.6 k引用

84%相关
性能
指标
不。会议前几年的文件
一年 论文
2021 45
2020 63
2019 69
2018 53
2017 56
2016 53