国产申威HPC放异彩 多核DSP不甘寂寞

上月国内首台全部采用国产中央处理器(CPU)和系统软件构建的千万亿次计算机系统引起不小轰动,外媒也大肆报道中国在HPC以及CPU领域的进展。装机8704片16核的“申威1600”处理器,由国家高性能集成电路(上海)设计中心自主研发,采用自主指令集,济南中心神威蓝光系统性能功耗比超过741MFLOPS/W(每瓦功耗所获取的运算性能)。不过据悉申威是在DEC alpha ISA的基础上发展而来,我国有关部门江南所多年改进而来。

长久以来CPU,GPU始终是HPC设计的不二选择,不过最近TI公司突然发现本为4G通信而在DSP中加入的浮点运算单元可能使其DSP产品线成为高性能计算领域的强有力竞争者。TI公司多核DSP商务经理Friedmann表示最新一代多核处理器完全胜任HPC需求,问题只在于应用实现的完美程度。

胜任这一伟大使命的是TI公司于2010年11月最新推出的TMS320C66x系列DSP,40nm工艺,有单核,双核,四核以及八核规格。与前一代C64x系统只支持定点运算相比,C66x增加了4G通信处理所需的浮点指令。架构基于TI最新的KeyStone,包括8阶VLIW架构,高速交换架构TeraNet,多核调度以及DMA引擎。用于数据和指令的L1 Cache 32KB,每核有专有L2 Cache 512KB。对于主频1.25GHz的8核C66x,单精度Gigaflops为160,功耗仅为10W,即16 SP gigaflops/watt.

据Friedmann介绍,已经有“相当多”的大学和商业HPC客户对DSP技术产生兴趣并安排人手移植应用,TI公司专门成立HPC部门。
第一款适用于HPC的C66x产品将是由4个运行在1GHz主频的八核DSP组成的PCIe板块,由Advantech代工的这块半长PCIe板卡功耗为50W,提供 512 SP gigaflops性能。板载内存大小为4G 1.333GHz DDR3 Memory。Nvidia最新的Tesla 20系列板卡功耗为225W,性能为1331 SP gigaflops,两者的性能/瓦特比分别为10和6。对比双精度运算,TI DSP性能为单精度性能的3/8,Tesla GPU则为1/2。总体来讲,TI DSP在能耗方面都更胜一筹。也许随着Nvidia在2012年推出Kepler,Intel在2013年推出Many Integrated Core (MIC)协处理器以后会提供性能/瓦特比更高的产品,但是TI应该也会相应推出升级产品。

一个待解的问题是如何在DSP上开发HPC风格的软件。

好在DSP与GPU和FPGA不同,它与CPU近似,TI的DSP不需要特殊的编程语言也无需主处理器驱动。通过传统的C语言工具,配套OpenMP或者MPI,整套应用都可以跑在DSP核上。TI的软件开发套件已经提供必备工具,包括C编译器,runtime以及对浮点运算和并行编程的支持。

TI的HPC部门也意识到同Intel和Nvidia成熟的并行编程环境相比还需要提升自身的软件工具,所以如果客户需要,TI甚至考虑移植OpenCL到DSP中。

目前TI的一个8-10人小团队正在基于最新的DSP做benchmark测试并移植一些潜在客户的代码,他们希望能展现出DSP在HPC领域的潜力,同这个领域的主流厂家Intel,Nvidia,AMD一决高下。

从Broadcom收购看以色列的风投行业

Broadcom收购Netlogic对国内目前还处于发展初期阶段的半导体行业来讲无关轻重,但是对于全球半导体行业来讲这是一个重要的序幕,它标志着高端数字芯片设计领域的收购大潮来临。

放眼望去,AlcaLu高调宣布400G网络处理器,华为Solar系列早已经不是秘密,Cisco/Juniper的高端ASIC也发货多年,Broadcom要想打进这几家的供应链除了交换机芯片还需要更多的武器,由此从收购以色列Dune公司开始到收购Netlogic,BRCM可以完美打造从Fabric到control/data层面的完整解决方案。另外据BRCM公司CTO的访谈,Netlogc公司收购的Optichron也有助于公司进入Wireless领域。

这次收购将Cavium/EZchip/Xelerated等公司放到了被收购的边缘。Xelerated要出售的传言已经很久,不知是地处欧洲还是产品线难以整合的缘故,靴子始终没有落地;Cavium出手位于北京的消费类公司芯晟,大概也是对多核产品线的高投入低产出头疼。

作为BRCM的老对手,受此次收购刺激最大的应该是Marvel。Marvel+EZchip拿下不少线卡份额,由此EZchip被Marvel收购的预期越来越大,EZchip的股价也创下两周来的新高。

回顾一下这些风光一时的公司就会发现有很多来自于以色列,Dune(BRCM收购)/Provigent(BRCM收购)/Zoran(CSR收购)/Wintegra(PMCS收购)/Ezchip/etc,虽然肯定也有很多倒在了黎明前,但是以色列的半导体产业链还是令人印象深刻。

以色列人口同瑞士相当,只有770万,但是它有57家公司在Nasdaq上市,排名仅次于中国(美国本土公司除外)。同时,以人均计算,它是全球初创公司最多的国家。

根据以色列风投KPMG7月13日发布的季度调查显示,以色列的科技公司在2011年的第二季度共募得资金$5.69亿美元,达到了两年内的最高值,去年同期是$3.43亿美元。去年5月,MSCI已经将以色列的股票市场评级为发达市场状态。

Fulcrum终入豪门 Intel意欲何为

Linley:6月19日,Intel宣布就收购Fulcrum达成一致,金额不详。Fulcrum公司主席 Mike Zeile以及CTO Uri Cummings连同75名员工进入英特尔。Fulcrum之前在四轮融资中共筹得1.16亿美金,最近一笔是2010年第二季度得到包括Intel在内的战略投资$15 million。

Fulcrum的IP主要集中在异步技术,被广泛应用于crossbar,memories和包处理。Fulcrum采用Nexus技术推出的10G以太网交换产品线,比起竞争对手具有低延时的特性。由此,Fulcrum在数据中心和服务提供商中赢得了一些客户,包括ALU,Arista,IBM和NEC。

虽然Fulcrum以低延时和创新的特性进入了以太网交换市场,但是Broadcom博通和Marvell美满科技已经弥补了很多延迟方面的差距并且在端口密度上保持领先。展望未来,Fulcrum很可能拉大与Broadcom的差距,由此此时退出对于一个初创公司和其投资者来讲合乎情理。考虑到Fulcrum不甚光明的前景,Intel做了一笔好买卖,收购金额或许远低于$50 million。

拥有了Fulcrum的技术,Intel显然可以加速创新并扩展收购而来的交换产品线,但是Intel并没有介绍其长期计划。由此并不清楚Intel收购Fulcrum是否是为了获得其客户比如有计划转与Broadcom合作的HP,亦或是Intel对以太网交换有大计划。

虽然收购Fulcrum对于Intel来讲是个机会,但是对于其他两个竞争对手来讲这也是个相当大的机会。我们预计10GbE交换市场在2010年有1.17亿美金,在接下来的3到5年内有两位数的CAGR增长。

Intel已然是以太网适配卡的领导者,有了交换业务后就可以为数据中心提供更加全面的方案。而有了Intel的支持,Fulcrum目前产品线的收入在接下来的三年内应该可以翻番。虽然Fulcum拥有领先的交换技术,但是同Broadcom的Fabrics技术相比缺乏可扩展性。从长期来看,Intel必须决定是否为了保持竞争力而扩展其交换产品线,或者集中火力于高端的数据中心交换。我们相信后一个策略从长期来讲不是一个可以持久的业务方向。

AlcaLu 400G网络处理器诞生的背后

ALU上月底宣布推出具有突破性的400G网络处理器FP3,从100G的FP2到400G的FP3,ALU在2003年收购的TiMetra团队再次立下战

功。从芯片角度看FP3大幅领先于专业网络处理器供应商如Ezchip/Xelerated;从产品角度看,基于FP3的7750业务路由器在端

口能力上将达到2 Tbit/s,不仅追赶上竞争对手并且基于FP3芯片的方案所需芯片数目更少,从功耗,板面积,成本方面都有更大的优势。

FP3是由网络处理器和流量管理器组成的两颗套片。如此给力领先的设计是高端数字芯片设计合作的一个完美范例,因为这颗芯片并不是ALU独立从零开始完成一切从前端到后端的设计,这颗芯片的诞生离不开ALU合作伙伴的支持。

ALU的新闻稿表明,FP3设计得到了Broadcom,Cypress,GSI,Micron,Netlogic和Samsung的大力支持。在内存以及内存接口方面,Cypress,GSI,Micron,Netlogic和Samsung等TCAM,Memory专业厂家应该提供了各自的IP core,博通在高速设计和接口方面应该发挥了最重要的作用。

早在TiMetra年代Broadcom就投资并与TiMetra在交换架构上有深入合作,如今再次联手,博通为ALU工程师提供了设计所需的很多工具,从设计软件工具到关键部分的IP core,比如Serdes,博通一共为ALU设计提供了100多个定制库。由此ALU的IP division总裁Basil Alwan认为Broadcom是ALU的“Foundry”。虽然Broadcom没有晶圆厂,并不作芯片生产代工服务,但这表明了Broadcom在这颗芯片中发挥的重要作用。

FP3的推出也带来了两个有意思的问题:

对于设备商来讲,高端芯片是采用商用产品还是自研?Cisco目前与Ezchip合作高端网络处理器,Juniper自家有Trio,华为在自研Solar,但是高端设备的发货量是否足以支撑如此大的投入,尤其是在45nm,28nm时代需要巨大投片成本的情况下。

传统上LSI/TI/IBM/Avago等厂家有提供芯片设计服务的业务,Broadcom是否也有进入这个业务领域的冲动?Broadcom的IP core数量和质量应该足以支撑博通进入这个领域。

盛科网络将获新一轮千万级投资

据lightreading报道,苏州盛科网络透露预计在今年六月底将会获得新一轮1千万美元的投资。据网络公开资料,盛科已经有6年没有融资,上一次是2005年6月,苏州创投投资盛科网络,金额为100万美元,所占股份18.26%。 此轮投资依然来自中国。

下面是来自江苏党的生活杂志的官方故事:2005年,孙健勇和郑晓阳离开思科公司回到苏州,成立了自己的集成电路设计公司——盛科网络。当时,除了“做中国思科”的梦,他们几乎是身无分文。他们找到了中新苏州工业园区创业投资有限公司。中新创投的高级副总裁费建江说:“风险投资就是一场赌博。我们其实并不要弄懂太多技术、学术名词,我们看的是人。”被两个年轻人的真诚、执著和激情所打动,在对履历、项目论证后,中新创投果断给出了100万美元风险投资,之后又几次追加。正是在有力的资金保障下,目前,盛科的芯片开发进展顺利,其目光开始瞄准像摩托罗拉那样有产业背景的海外公司,正在展开第二轮融资。

Broadcom博通统治了以太网交换芯片领域,由此设备公司很希望能有竞争者出现。但交换架构是系统设计的关键部分,由此很少有公司愿意把这一部分设计托付给一家初创公司,这也使得盛科的发展并不是很快。

有消息称海思曾经有意收购盛科,但是到目前为止并没有进一步消息。

飞思卡尔艰难上市 半导体股难获青睐

飞思卡尔IPO价格大幅下降,上市日以$18共卖出43.5 million份股份,融资7.83亿美金,远低于预期的每股$22到$24,融资15亿美金。

飞思卡尔在2006年被私募公司包括黑石,凯雷,TPG和Permira私有化,在此次IPO中这些股东公司都没有出售股份。

投资人对今年年初上市的其它大型私募持有的公司股票更感兴趣。同样是由私募公司引领上市,医院经营公司HCA,石油管道公司Kinder Morgan Inc和消费品评级公司 Nielsen Holdings NV都募得了几十亿的资金。

但是飞思卡尔没有享受到同等的待遇,虽然与经济危机时的业绩巨幅下滑相比飞思卡尔去年的收入增加了27%,但是公司仍然未能盈利。到2010年底飞思卡尔有76亿美元的债务,IPO募集资金将有助于偿还部分债务。

飞思卡尔的主要客户包括:阿朗,思科,摩托罗拉和黑莓制造商RIM。

EZchip公布更多200G网络处理器细节

网络处理器专业厂商EZchip公司公布了其下一代NP-5处理器的细节。NP-5网络处理器(NPU)处理能力将为200G,内置200G的流量管理单元,这将有效降低交换机/路由器的10GE, 40GE和100GE线卡的密度。同时正在设计中的NP-5将为现在使用NP-4 100G芯片的用户提供升级路径,代码后向兼容NP-4,由此在很少软件工作量的情况下客户可以将线卡的带宽和端口密度翻倍。

NP-4采用55nm工艺,计划于2011年下半年进入量产阶段。NP-5将采用28nm工艺,计划于2012年底推出样片。

EZchip公司将在Linley Tech于6月7-8号在美国加州举办的运营商大会上介绍NP-5。

NP-5的主要特性包括:

  • 200-Gigabit programmable packet processing
  • Integrated 200-Gigabit hierarchical traffic management
  • Ethernet ports with integrated MACs supporting 48×10-Gigabit / 12 x 40-Gigabit / 4×100-Gigabit interfaces or combinations thereof
  • Enhanced memory management for lookup tables, packet buffering and statistics, all using commodity DDR3 devices for minimized cost and power
  • Integrated fabric adaptor for interfacing to Ethernet-based switch-fabrics and 10GBase-KR links for direct connection to the system’s backplane
  • Power management for minimizing line card and system power dissipation
  • Enhanced support for video streams and IPTV
  • On-chip control CPU for host CPU offload
  • Operations, Administration and Management (OAM) processing offload
  • Synchronous Ethernet and IEEE1588v2 offload for Circuit Emulation Services
  • IP reassembly for advanced packet processing offload

俄罗斯基金投资Crocus公司 3亿资本助力MRAM技术商用化

芯情报报道:俄罗斯政府通过其国有的纳米科技投资基金Rusnano已向一家名为Crocus的芯片公司投入2.45亿美元资金。Crocus上轮已经收到6千万风险投资,所以此轮风投将再募集$55 million,Rusnano投入2.45亿,总共3亿资金将用来组建一个俄罗斯合资公司生产MRAM,领导层来自Rusnano。

Crocus公司2004年成立于法国的Grenoble,主要目的是将Spintec实验室(一家隶属于法国原子能委员会<CEA>和法国国家科研中心<CNRS>的研发中心)的MRAM(磁性随机存储)研究商用化。公司后来将总部迁到美国加州的Sunnyvale,但是工程团队留在Grenoble。Crocus目前采用以色列独立专业晶圆代工厂塔尔半导体(Tower Semiconductor)的130nm制程来生产MRAM。

MRAM存储技术当前被业内密切关注,因为该技术被认为将取代当前从智能手机到工业机器人所使用的所有存储芯片。MRAM是一种非挥发性的磁性随机存储器,关掉电源后,仍可以保持记忆完整,功能与闪存雷同,而写入速度比闪存快。MRAM的这些特点让人们把它看做是潜在的“通用”芯片:一旦开发完成,MRAM将会有潜力统治存储芯片市场。

MRAM存储芯片的开发已历经多年,但尚未取得突破性进展,这部分的归咎于很少有投资人愿意为实验室投入数亿美元,用于开发MRAM芯片。包括Crocus、EverSpin和Gradis等数家公司都在大力推进MRAM芯片的开发。

俄罗斯政府正寻求把通过出售石油获得的资金投入到高科技项目当中。在签订该协议之前,一些美国投资人曾在一年前前往俄罗斯。在他们当中,包括了风险投资公司Sofinnova Ventures合伙人埃里克·布阿特斯(Eric Buatois)。Sofinnova Ventures是Crocus的投资人之一,在访问期间,布阿特斯曾与俄罗斯国有投资公司RUSNANO进行过接触。在随后的一年时间里,布阿特斯与RUSNANO进行了很多次的接触,并最终促成了RUSNANO对Crocus的投资。

RUSNANO目前已对大约100个项目投入了45亿美元资金,但是在固体微电子领域它还没有太多成功故事。它与俄罗斯本土领先的芯片公司Mikron的母公司Sitronics JSC在300mm晶圆厂合作上分分和和;同时它还支持了对美国Plastic Logic公司7亿美金的投资,用来在俄罗斯建设塑料电子生产线。

众巨头聚首 开放虚拟化联盟成立

本周二,在San Francisco旧金山举行的开源商务大会上,HP (HPQ), IBM, Intel (INTC), BMC Software (BMC), Red Hat (RHT), Eucalyptus Systems和SUSE联合宣布成立开放虚拟化联盟,旨在推动开源的虚拟化技术的应用,包括基于内核的虚拟机(KVM)。

对开源社区的补充

开放联盟将会为各种商务应用提供培训,实践和技术指导,同时也会为负责KVM程序和相关管理程序开发的开源社区提供补充支持。他们也会鼓励互通并围绕KVM加速第三方生态系统的扩展。大概从2007年起,KVM虚拟化开始利用Intel和AMD处理器原生支持来构建稳健高效的Linux和Windows虚拟机。

共同的目标

开放虚拟化联盟的成员在助力开放虚拟化方面都有共同的目标,因为这会使他们的客户有机会选择与自身商业应用最匹配的虚拟化产品。SPECvirt_sc2010基准测试是用来评估整个系统(包括硬件,虚拟化平台以及虚拟化的子操作系统和应用软件)端到端性能的工具,HP,IBM和红帽都拥有很多关于SPECvirt_sc2010基准测试的记录。

成员发言

红帽VP,云业务经理Scott Crenshaw表示:当一家公司独大霸占产业将会损害重新,客户成为冤大头。红帽和联盟旨在打破封闭的虚拟化,为客户提供更佳的性价比。

HP公司VP Paul Miller表示:有了联盟支持的核心虚拟机将会提供更多灵活性,与HP的产品架构兼容。

移动芯片业务推高Ceva公司业绩预期

芯情报报道:在授权客户Broadcom博通,Infineon英飞凌,Spreadtrum展讯,ST Ericsoon爱立信市占率提升的同时,总部位于美国加利福尼亚州圣荷塞的以色列IP公司Ceva调高了2011年业绩预期。由于这些Ceva的DSP 授权客户在手持和平板等市场的成功,Ceva将2011年利润预期上调24-28%,达到$55.6-$57.6 million,而此前预期为$53.1-$55.1 million。目前第一季度利润创纪录的达到$15.1 million,第二季度利润预计为$12.4-$14.4 million。

据公司介绍,Ceva在手持和非手持方面的网络基带业务继续爆发性增长,在2011年第一季度有超过2.1亿片基于Ceva的无线芯片发货。除了手持业务,Ceva强调在无线基础架构和智能电网市场也获得了新的客户。

具体如下:新授权合同中有4个是DSP核,平台和软件,其余3个为SATA/SAS产品线。客户的目标应用为3G和4G终端的基带处理器,通信基础架构,智能电网和SSD驱动。从地理区域讲3个在美国,3个在亚洲,另外一个在欧洲。

Ceva目前在全球手持和平板市场的占有率为41%,领先于高通,德仪和联发科(指DSP core)。