當(dāng)前位置:首頁 > 百科知識 > 電子工程 > 正文

龍芯 又名:Loongson

龍芯是中國科學(xué)院計算所自主研發(fā)的通用CPU,采用簡單指令集,類似于MIPS指令集。龍芯1號的頻率為266MHz,最早在2002年開始使用。龍芯2號的頻率最高為1GHz。龍芯3A是首款國產(chǎn)商用4核處理器,其工作頻率為900MHz~1GHz。龍芯3A的峰值計算能力達到16GFLOPS。龍芯3B是首款國產(chǎn)商用8核處理器,主頻達到1GHz,支持向量運算加速,峰值計算能力達到128GFLOPS,具有很高的性能功耗比。

研發(fā)背景

  據(jù)美國《華爾街日報》2015年4月9日報道,美國政府禁止企業(yè)向與世界上運算速度最快的超級計算機有關(guān)的中國設(shè)施出口技術(shù),這對英特爾和其他硬件供應(yīng)商來說是一個打擊,給中美兩國之間的一系列科技爭端再添一項。

  這一限令包含在美國商務(wù)部發(fā)布在聯(lián)邦政府網(wǎng)站的一份公告中,其日期標(biāo)明為2月18日,即中國除夕,但直到4月9日才有媒體獲悉其存在。被列入限制名單的分別是中國國防科學(xué)技術(shù)大學(xué)、國家超級計算機長沙中心、國家超級計算機天津中心和國家超級計算機廣州中心。

  公告聲稱,美國政府認(rèn)定名單上的這些機構(gòu)“涉及違反美國國家安全或外交政策利益的活動”。例如,“中國國防科學(xué)技術(shù)大學(xué)采用源自美國的多核、主板和處理器生產(chǎn)天河-1A和天河二號”,這兩個系統(tǒng)“據(jù)信被用于核爆炸活動”。

  如果有美國公司要向名單上的4家中國機構(gòu)出售相關(guān)技術(shù),必須先向美國政府申請出口許可。但正如公告所指出的那樣,這類許可的申請“通常會遭到政策性的拒絕”。因此這一公告實際上相當(dāng)于禁令。

研制課題

  2001年5月,在中科院計算所知識創(chuàng)新工程的支持下,龍芯課題組正式成立。2002年8月10日,首片龍芯1號芯片X1A50流片成功.龍芯最初的英文名字是Godson,后來正式注冊的英文名為Longstanding。龍芯CPU由中國科學(xué)院計算技術(shù)所龍芯課題組研制.由中國科學(xué)院計算技術(shù)所授權(quán)的北京神州龍芯集成電路設(shè)計公司研發(fā),前期批量樣品由臺灣臺積電生產(chǎn)。

  盡管今天的“龍芯”還存在著諸多問題與目前主流CPU相比性能上還有不少差距,還不能與Intel和AMD的CPU在PC市場上競爭,但坦率講,今天“龍芯”的境遇已經(jīng)比當(dāng)年的“聯(lián)想漢卡”好多了?;叵氘?dāng)年的“聯(lián)想漢卡”是由做大型機出身的毫無產(chǎn)業(yè)經(jīng)驗的科研人員一塊一塊的手工焊接而成、又一塊一塊的人工檢測。據(jù)說1986年,聯(lián)想第一線銷售人員每天接到的投訴電話和定貨電話幾乎一樣多----每賣出100塊“漢卡”,就有30塊出問題;而今天的“龍芯”不僅獲得了中科院重大知識創(chuàng)新工程項目和國家863計劃的支持,通過了嚴(yán)格的成果鑒定、基準(zhǔn)程序測試和產(chǎn)品測試,可進入商品化生產(chǎn);還得到了各地政府和企業(yè)的大力支持,已在江蘇省常熟市建立了產(chǎn)業(yè)化基地。關(guān)于MIPS結(jié)構(gòu)授權(quán)與龍芯自主性等問題(From采訪龍芯總設(shè)計師胡偉武)

龍芯架構(gòu)

  龍芯指令集:

  CPU訪存指令24個全部來自MIPS

  CPU算數(shù)指令(ALU)10個全部來自MIPS

  CPU算數(shù)指令14個全部來自MIPS

  CPU乘除指令12個來自MIPS

  12個來自龍芯(其中8個重復(fù)MIPS指令功能)

  CPU跳轉(zhuǎn)分支指令20個全部來自MIPS

  CPU位移指令15個全部來自MIPS 

  CPU特殊指令2個全部來自MIPS

  CPU異常指令12個全部來自MIPS

  CPUCPO指令10個全部來自MIPS

  龍芯處理器共131個指令,其中119個來自MIPS,12個來自龍芯(但其中MULTG、DMULTG、MULTUG、DMULTUG、DIVG、DDIVG、DIVUG、DDIVUG共8個重復(fù)MIPS的指令功能。)

研制年譜

  2001年5月,在(中國大陸)中科院計算所知識創(chuàng)新工程的支持下,龍芯課題組正式成立。

  2001年8月19日,龍芯1號設(shè)計與驗證系統(tǒng)成功啟動linux操作系統(tǒng),10月10日通過由中國科學(xué)院組織的鑒定。

  2002年8月10日,首片龍芯1號龍芯XIA50流片成功。

  2002年9月22日龍芯1號通過由中國科學(xué)院組織的鑒定,9月28日舉行龍芯1號發(fā)布會。中國人大常委會副委員長路甬祥、全國政協(xié)副主席周光召參加了龍芯1號發(fā)布會。

  2003年10月17日,龍芯2號首片MZD110流片成功。

  2004年9月28日,經(jīng)過多次改進后的龍芯2C芯片DXP100流片成功。

  2004年11月,中國國務(wù)院總理溫家寶視察中科院計算所聽取龍芯研發(fā)情況匯報。

  2005年2月,中國國家主席胡錦濤等黨和國家領(lǐng)導(dǎo)人在參觀中科院建院55周年展覽時參觀了龍芯處理器展覽。

  2005年1月31日舉行了由中國科學(xué)院組織的龍芯2號鑒定會,2005年4月18日在北京人民大會堂召開了由科技部、中科院和信息產(chǎn)業(yè)部聯(lián)合舉辦的龍芯2號發(fā)布會,人大常委會副委員長顧秀蓮參加了龍芯2號發(fā)布會。

  2006年3月18日,龍芯2號增強型處理器CZ70流片成功。“龍芯”也要對Intel說“不”了(此說法有帶廣告宣傳的性質(zhì))

  2006年10月,中法兩國在北京簽署了關(guān)于中國科學(xué)院與意法半導(dǎo)體公司關(guān)于龍芯處理器的戰(zhàn)略合作協(xié)議,中國國家主席胡錦濤與法國總統(tǒng)希拉克共同出席了協(xié)議的簽字儀式。

  2007年7月31日,龍芯2F(代號PLA80)流片成功,龍芯2F為龍芯第一款產(chǎn)品芯片。

  2008年3月,北京龍芯中科技術(shù)服務(wù)中心有限公司正式成立,龍芯開始產(chǎn)業(yè)探索。

  2009年9月28日,我國首款四核CPU龍芯3A(代號PRC60)流片成功。

  2010年9月,龍芯大CPU系列的首款多核處理器產(chǎn)品——龍芯3A開始量產(chǎn),中CPU系列的最新產(chǎn)品龍芯2G流片成功。龍芯2G在設(shè)計規(guī)格上相當(dāng)于龍芯3A的單核版。與上一代龍芯2F相比,在二級緩存容量、IO總線帶寬,配套橋片性能上都有大幅提升。龍芯2G目前在1GHz情況下運行穩(wěn)定,可提供更好地用戶體驗,并適用于筆記本電腦與瘦客戶機等移動與桌面市場。

  2011年初,龍芯一號系列芯片家族中的新成員——龍芯1B芯片流片成功,龍芯1B是一款32位SoC芯片,片內(nèi)集成32位處理器核、LCD顯示接口、以及豐富的IO接口。該款芯片延續(xù)了龍芯處理器高性能、低功耗的優(yōu)勢,能夠滿足超低價位云終端、工業(yè)控制/數(shù)據(jù)采集、網(wǎng)絡(luò)設(shè)備、消費類電子等領(lǐng)域需求。

  2011年4月,龍芯3B流片成功。龍芯3B仍采用65納米生產(chǎn)工藝,在單個芯片上集成8個增強型龍芯GS464處理器核,它可以與MIPS64兼容,并支持X86虛擬機和向量擴展。在1G主頻下可實現(xiàn)128Gflops的運算能力。在存儲設(shè)計方面,龍芯3B最多可同時處理64個訪問請求,可提供12.8GB/S的訪存帶寬。在I/O接口方面,龍芯3B實現(xiàn)2個16位的HyperTransport接口,可提供高達12.8GB/S的IO吞吐能力。八核龍芯3號的芯片對外接口與四核龍芯3號完全一致,兩款芯片引腳完全兼容,可實現(xiàn)無縫更換。

  2011年底,在國家核高基項目的支持下,龍芯歷史上最為復(fù)雜,也是設(shè)計難度最高的一款芯片--龍芯2H流片成功。

  2012年10月,龍芯3B1500流片成功。處理器采用32納米工藝,硅片面積160mm2。支持1.15v-1.3v變壓,動態(tài)變頻。實測核心頻率1.3GHz-1.5GHz,HT總線頻率1600MHz,DDR3總線頻率600MHz以上。龍芯3B1500集成8核向量處理器,峰值運算能力可達192GFLOPS,功耗約為40w。每核配置兩級私有256KB緩存,所有核心共享片上三級緩存,總?cè)萘窟_8MB。支持雙處理器通過HT總線直連構(gòu)成16核CC-NUMA系統(tǒng)。龍芯3B1500處理器結(jié)構(gòu)及封裝引腳基本兼容龍芯3B1000。龍芯3A/3B使用的內(nèi)核、操作系統(tǒng)及上層應(yīng)用可支持龍芯3B1500。

  2013年4月,龍芯1C芯片[5]流片成功,龍芯1C芯片是基于LS232處理器核的高性價比單芯片系統(tǒng),可應(yīng)用于指紋生物識別、物聯(lián)傳感等領(lǐng)域。

  2014年3月19日,龍芯1D芯片的量產(chǎn)版本(LS1D4)完成流片封裝。龍芯1D是一款專門為超聲波流量表應(yīng)用而定制設(shè)計的數(shù)模混合SoC,片上集成了LS132處理器核、超聲波時間測量、超聲波脈沖發(fā)生器、溫度測量單元、紅外收發(fā)器、段式LCD控制器、A/D、空管檢測單元、超聲波換能器正常檢測、模擬比較器等功能部件以及串口、液晶顯示等接口。龍芯1D具有高精度、低功耗、低成本的特性,擁有廣闊的市場前景。

  2014年4月,龍芯公司推出了龍芯3B六核桌面解決方案。龍芯3B六核芯片是一個配置為六核的高性能通用處理器,采用32nm工藝制造,工作主頻為1.2GHZ。該解決方案使用miniitx規(guī)格主板,板載AMDRS780E南橋芯片,配置1個千兆網(wǎng)絡(luò)接口,另外具有PCI、PCIe、SATA、USB等多種外設(shè)接口,并且可配備hd6770獨立顯卡以及SSD硬盤等,具有良好的可擴展性。

  眾所周知,CPU是決定電腦性能的核心部件,也是整個系統(tǒng)的核心。其負(fù)責(zé)整個系統(tǒng)指令的執(zhí)行、數(shù)學(xué)與邏輯的運算;數(shù)據(jù)的存儲與傳送;以及對內(nèi)對外輸入/輸出的控制。而在這個電腦核心部件市場領(lǐng)域里,人們最為熟悉的兩個品牌無疑是Intel和AMD,他們在處理器市場的強勢地位似乎無人能撼動。在CPU技術(shù)上,我們跟國外廠商有著較大的差距,缺乏具有自主知識產(chǎn)權(quán)的CPU芯片,是中國計算機產(chǎn)業(yè)的一大“芯”病,也是我們這些電子工作者、網(wǎng)絡(luò)人胸口永遠(yuǎn)的痛。

  過去,代表著國際IT頂尖技術(shù)的CPU芯片一直被英特爾等國外巨頭所壟斷,中國企業(yè)及消費者為之付出了巨額版權(quán)費。好在神州龍芯公司先后推出了“龍芯1號”、“龍芯2號”,打破了中國無“芯”的歷史。“龍芯”的誕生被業(yè)內(nèi)人士譽為民族科技產(chǎn)業(yè)化道路上的一個里程碑。商品化的“龍芯”1號CPU的研制成功標(biāo)志著中國已打破國外壟斷。

  初步掌握了當(dāng)代CPU設(shè)計的關(guān)鍵技術(shù),為改變中國信息產(chǎn)業(yè)“無芯”的局面邁出了重要的步伐,對中國形成有自主知識產(chǎn)權(quán)的計算機產(chǎn)業(yè)有重要的推動作用,對中國的CPU核心技術(shù)、國家安全、經(jīng)濟發(fā)展都有舉足輕重的作用。我們有信心:“龍芯”對Intel說“不”!

龍芯片系列

  龍芯一號

 ?。ㄓ⑽拿QGodson-1)

  龍芯一號CPUIP核是兼顧通用及嵌入式CPU特點的32位處理器內(nèi)核,采用類MIPSIII指令集,具有七級流水線、32位整數(shù)單元和64位浮點單元。龍芯一號CPUIP核具有高度靈活的可配置性,方便集成的各種標(biāo)準(zhǔn)接口。圖1顯示了龍芯一號CPUIP核可配置結(jié)構(gòu),其中虛線部分表示用戶可根據(jù)自己的需求進行選擇配置,從而定制出最適合用戶應(yīng)用的處理器結(jié)構(gòu)。主要的可配置模塊包括:浮點部件、多媒體部件、內(nèi)存管理、Cache、協(xié)處理器接口。浮點部件完全兼容MIPS的浮點指令集合,浮點部件及其相關(guān)的系統(tǒng)軟件完全符合ANSI/IEEE754-1985二進制浮點運算標(biāo)準(zhǔn)。浮點部件主要包括浮點ALU部件和浮點乘法/除法部件,用戶可根據(jù)自己的實際應(yīng)用選擇是否添加。媒體部件復(fù)用了MIPS浮點指令的Format域,并復(fù)用了浮點寄存器堆,媒體指令集基本對應(yīng)了IntelSSE媒體指令集合的各種操作。

  內(nèi)存管理部件有三種工作模式,即標(biāo)準(zhǔn)模式、直接映射模式和無映射模式。在標(biāo)準(zhǔn)模式下,TLB分為ITLB和DTLB兩部分,每部分均由48項頁表項組成,同時支持mapped和unmapped的從虛擬地址到物理地址的變換方式;TLB也可只進行直接映射,不使用CAMRAM,以減小面積;而無映射模式下甚至可以去掉TLB,采用直連SRAM的形式實現(xiàn)訪存。龍芯一號CPUIP核的Cache分為指令Cache和數(shù)據(jù)Cache,兩部分獨立配置,以4K為一路,可配置為4路、2路和0路。用戶可根據(jù)應(yīng)用需要,確定所需Cache的大小,甚至不使用Cache。協(xié)處理器接口為外部協(xié)處理器提供了一個高效率的接口。龍芯一號CPUIP核提供了兩套可配置的處理器總線接口:AMBA接口和哈佛結(jié)構(gòu)SRAM接口。

  龍芯二號

 ?。ㄓ⑽拿QGodson-2)

  龍芯二號CPU采用先進的四發(fā)射超標(biāo)量超流水結(jié)構(gòu),片內(nèi)一級指令和數(shù)據(jù)高速緩存各64KB,片外二級高速緩存最多可達8MB.最高頻率為1000MHz,功耗為3-5瓦,遠(yuǎn)遠(yuǎn)低于國外同類芯片,其SPECCPU2000測試程序的實測性能是1.3GHz的威盛處理器的2-3倍,已達到中等Pentium4水平。

  龍芯三號

 ?。ㄓ⑽拿QGodson-3)

  龍芯3A的工作頻率為900MHz~1GHz,功耗約15W,頻率為1GHz時雙精度浮點運算速度峰值達到每秒160億次,單精度浮點運算速度峰值每秒320億次。龍芯3A采用意法半導(dǎo)體公司(STMicro)65納米CMOS工藝生產(chǎn),晶體管數(shù)目達4.25億個,芯片采用BGA封裝,引腳的數(shù)目為1121個,功耗小于15瓦。龍芯3A集成了四個64位超標(biāo)量處理器核、4MB的二級Cache、兩個DDR2/3內(nèi)存控制器、兩個高性能HyperTransport控制器、一個PCI/PCIX控制器以及LPC、SPI、UART、GPIO等低速I/O控制器。龍芯3A的指令系統(tǒng)與MIPS64兼容并通過指令擴展支持X86二進制翻譯。

產(chǎn)品架構(gòu)

  架構(gòu)

  靈活的可配置IP核架構(gòu)Cache容量可配置0/4K/8K/16KI/DCacheTLB形式可配置

  接口

  可配置接口AMBA2.0fullcompatibleDirectRAM(HarvardStructure)MIPSSYSADCo-processorIntelface內(nèi)外時鐘關(guān)系可配置IEEE754兼容FPU可配置MMX部件可配置EJTAG接口,便于SOC調(diào)試功耗具體配置相關(guān),Typical::1~2mW/MHz

  面積

  與具體配置相關(guān),Min:1.0mm2(軟IP)友好的IP用戶接口可視化配置界面完全可綜合的IP,可無縫銜接主流EDA工具集成synthesis環(huán)境verilog仿真模型IPModelingISS仿真器SoC硬件驗證平臺SoC系統(tǒng)虛擬開發(fā)平臺軟/硬IPIP抽象模型提取,提供工業(yè)格式文件硬IP的實現(xiàn)(0.18微米/0.13微米工藝)IP架構(gòu)增強可配置靈活性在面積、功耗上持續(xù)優(yōu)化針對應(yīng)用不斷增強處理能力(加密安全,控制,JAVA)增加對多核的支持SOC開發(fā)平臺提供基于EJTAG的IDE提供ISS用于性能評估

  系統(tǒng)

  硬件開發(fā)板操作系統(tǒng)LinuxOpenBSD(N64ABI)VxWorksWinCE

  軟件支持

  軟件支持XFree86-4.1.0XServerMozillaBrowser,ApacheWEBserverCompiler:GCC,F77Wordprocessing,videoserverVirtualTerminalforXandWind

產(chǎn)品介紹

  龍芯1號

  龍芯1號(英文名稱Godson-1)于2002年研發(fā)完成,32位,主頻266MHz。

  龍芯1D

  龍芯1D于2012年6月完成設(shè)計并進入流片狀態(tài),是專門為超聲波熱量表定制的高精度、低功耗測量SoC。

  龍芯1D集成的時間數(shù)字轉(zhuǎn)換器設(shè)計測量分辨率可達15ps,能夠檢測極其微小的流量變化。在電源管理方面,龍芯1D包含11個電源域,可將待機電流控制在10uA以下。測量過程的軟硬件協(xié)同設(shè)計使得龍芯1D在熱量表中用一個電池能工作五年以上。

  除了熱量表,龍芯1D還可以應(yīng)用在水表、激光測距、重量測量等場合,是一個非常值得期待的產(chǎn)品。

  最初版本

  龍芯2號(英文名稱Godson-2)

  于2003年正式完成并發(fā)布。

  龍芯2號是64位處理器,主頻為300MHz至1000MHz,500MHz版約與1GHz版的IntelPentiumIII、Pentium4擁有相近的效能水平。

  龍芯2號最初的版本是用0.13微米工藝,往后也會使用更精細(xì)的工藝。事實上龍芯2號當(dāng)稱為一個系列,過程中經(jīng)過數(shù)次改進,已知的有2、2A、2B、2C、2E、2F等型號,龍芯2號處理器已用于黃羊河公司(YellowSheepRiver,簡稱:YSR)的低價型Linux臺式機:Municator中,最初的售價約為1200元人民幣。其電腦皆曾在2006年3月德國漢諾威CeBIT及6月的臺北國際電腦展覽會中展出。

  龍芯2E

  2006年6月,龍芯2E繼成功在法國流片成功后,全世界排名第五位的集成電路生產(chǎn)商--意法半導(dǎo)體公司與中科院計算所簽訂技術(shù)許可協(xié)議,購買龍芯2E的生產(chǎn)和全球銷售權(quán)。意法半導(dǎo)體計劃每年銷售龍芯芯片1000萬片以上。

  2006年9月13日,中國科學(xué)家宣布研制成功通用中央處理器芯片龍芯2E。它是一款采用64位MIPSⅢ指令集的RISC處理器,采用90納米的CMOS工藝,晶體管數(shù)目是4700萬個,芯片面積是6.8mm×5.2mm。最高主頻達到1.0GHz,一般頻率是800MHz,功耗大約是5-7瓦。實際運行頻率定于660MHz。規(guī)格方面,龍芯2E處理器有128KB一級緩存、512KB二級緩存。性能方面,它的單精度浮點運算速度是每秒80億次,雙精度浮點運算速度是每秒40億次。龍芯2E在1.0GHz主頻下,SPECCPU2000的得分為500分,綜合性能達到PentiumIII和Pentium4的水平。

  龍芯2F

  龍芯2F與龍芯2E相比,主要有以下幾個方面的提高。一是主頻提高30%以上,通過頻率篩選,將有1GHz以上的產(chǎn)品。二是相同頻率下功耗降低40%左右,并增加了很多諸如降頻、溫度傳感器、關(guān)閉L2等功耗管理功能。三是集成了更多的系統(tǒng)功能,除了CPU外,還集成了DDR2內(nèi)存控制器、66MHzPCI/100MHzPCIX控制器、LocalIO控制器、GPIO、中斷控制器、DMA控制器、部分顯示加速等功能,將大幅度降低系統(tǒng)成本。四是封裝更小,龍芯2E的封裝為35mm*35mm,龍芯2F為27mm*27mm。五是可測性設(shè)計(DFT)和可生產(chǎn)性設(shè)計(DFM)有明顯提高,因此可以降低芯片成本。

  龍芯2G

  龍芯2G在設(shè)計規(guī)格上相當(dāng)于龍芯3A的單核版。與上一代龍芯2F相比,在二級緩存容量、IO總線帶寬,配套橋片性能上都有大幅提升。龍芯2G在1GHz情況下運行穩(wěn)定,可提供更好地用戶體驗,并適用于筆記本電腦與瘦客戶機等移動與桌面市場。

  龍芯2H

  龍芯2H已于2012年底完成了流片,64nm工藝,它在一個芯片中集成了CPU,GPU,北橋芯片,南橋芯片,內(nèi)存控制器,顯卡,網(wǎng)卡,聲卡,USB模塊等各種IO接口。芯片高度SOC設(shè)計,最大功耗為4W,主頻1GHz,是龍芯家族中集成度最高的芯片。主要面向移動終端,筆記本電腦,平板電腦等移動處理器。

  龍芯3A

  中國第一個具有完全自主知識產(chǎn)權(quán)的四核CPU,龍芯3號處理器采用的是65nm(納米)工藝,主頻1GHz,晶體管數(shù)目4.25億個,單顆龍芯3A的最大功耗為15W,理論峰值為16Gflops,每顆CPU單瓦特能效比1.06Gflops/W是目前X86CPU的2倍以上,達到了世界先進水平。龍芯3號多核CPU系列產(chǎn)品定位服務(wù)器和高性能計算機應(yīng)用。

  龍芯3A集成了四個64位超標(biāo)量處理器核、4MB的二級Cache、兩個DDR2/3內(nèi)存控制器、兩個高性能HyperTransport控制器、一個PCI/PCIX控制器以及LPC、SPI、UART、GPIO等低速I/O控制器。龍芯3A的指令系統(tǒng)與MIPS64兼容并通過指令擴展支持X86二進制翻譯。

  龍芯3B

  繼龍芯3A后,龍芯3號系列處理器的第二代產(chǎn)品——8核龍芯3B處理器已于2012年年初流片成功。龍芯公司相關(guān)部門正在對該款芯片做進一步的開發(fā)和測試工作。預(yù)計2012年夏天實現(xiàn)量產(chǎn)。

  龍芯3B仍采用65納米生產(chǎn)工藝,在單個芯片上集成8個增強型龍芯GS464處理器核,它可以與MIPS64兼容,并支持X86虛擬機和向量擴展。在1G主頻下可實現(xiàn)128Gflops的運算能力。在存儲設(shè)計方面,龍芯3B最多可同時處理64個訪問請求,可提供12.8GB/S的訪存帶寬。在I/O接口方面,龍芯3B實現(xiàn)2個16位的HyperTransport接口,可提供高達12.8GB/S的IO吞吐能力。八核龍芯3號的芯片對外接口與四核龍芯3號完全一致,兩款芯片引腳完全兼容,可實現(xiàn)無縫更換。

  我國首臺采用自主設(shè)計的“龍芯3B”八核處理器的萬億次高性能計算機“KD-90”,由中國科學(xué)技術(shù)大學(xué)與深圳大學(xué)聯(lián)合研制成功。

  高性能計算機KD-90采用單一機箱,集成了10顆八核龍芯3B處理器,理論峰值計算能力達到每秒1萬億次。系統(tǒng)硬件由1個前置服務(wù)器、5個計算節(jié)點、2個千兆以太網(wǎng)交換機以及監(jiān)控單元組成。其中,前置服務(wù)器和計算節(jié)點均采用了我國自主設(shè)計的龍芯3B八核處理器,主要互連部件采用了自主研發(fā)的超多端口千兆以太網(wǎng)交換芯片。系統(tǒng)軟件以開源軟件為主,其中包括針對龍芯3B處理器結(jié)構(gòu)專門優(yōu)化的數(shù)學(xué)函數(shù)庫,以及自主研發(fā)的圖形化系統(tǒng)監(jiān)控管理軟件,具有兼容性強、易維護、易升級、易使用等特點。

  KD-90的研制依托國家科技重大專項“高性能多核CPU研發(fā)與應(yīng)用”項目的支持,由中科院院士、中國科技大學(xué)教授陳國良為負(fù)責(zé)人的科研團隊,歷時近一年攻關(guān)成功。與基上一代“龍芯”處理器的國產(chǎn)高性能計算機KD-60相比,KD-90系統(tǒng)實現(xiàn)了“三低一高”的特性:成本低于20萬元,功耗低于900W,體積降低至0.12平方米,性能高達每秒1萬億次。

  以中科院院士陸汝鈐為組長的專家組鑒定后認(rèn)為,KD-90是我國高性能計算機國產(chǎn)化的又一次重要突破,在編程模型和互聯(lián)網(wǎng)絡(luò)等關(guān)鍵技術(shù)上達到了世界先進水平。適用于高性能計算教學(xué)、大規(guī)??茖W(xué)與工程計算,以及軍事科學(xué)、國家安全和國民經(jīng)濟建設(shè)等領(lǐng)域,應(yīng)用前景廣闊。

  龍芯3B1500

  在核高基項目支持下,龍芯3B1500處理器流片成功。龍芯3B1500集成8核向量處理器,32納米工藝,主頻1.3—1.5GHz,硅片面積182.5mm2,支持1.15v-1.3v變壓和動態(tài)變頻。龍芯3B1500結(jié)構(gòu)及封裝引腳基本兼容龍芯3B1000,性能較龍芯四核3A處理器大幅提升。龍芯3B1500流片成功,標(biāo)志著核高基支持任務(wù)的技術(shù)指標(biāo)全面完成。

龍芯規(guī)格

  龍芯1A

  主頻300MHz

  微體系結(jié)構(gòu)集成32位超標(biāo)量處理器核,該處理器核具有如下特點:支持MIPS32指令集;5級流水線結(jié)構(gòu);雙發(fā)射亂序執(zhí)行結(jié)構(gòu);1個定點單元、1個浮點單元和1個訪存單元;采用交叉開關(guān)和多級AMBA總線橋進行片內(nèi)的互連

  高速緩存一級指令cache和數(shù)據(jù)cache各16KB

  內(nèi)存控制器1個32/16位DDR2-333控制器

  音視頻支持1920*1080/60fps的LCD+VGA控制器;AC97音頻控制器;333控制器

  I/OUSB2.0/1.1*4;SATA2*2;GMAC*2;PCIHost/Device、LPC、I2C、CAN;SPI、NAND;UART*4、RTC、PWM、GPIO*88等I/O控制器

  制造工藝130nmCMOS工藝

  封裝23mm*23mmBGA封裝,448個引腳

  功耗1.0W;支持動態(tài)電源管理

  龍芯1B

  主頻200MHz

  微體系結(jié)構(gòu)集成32位超標(biāo)量處理器核,該處理器核具有如下特點:支持MIPS32指令集;5級流水線結(jié)構(gòu);雙發(fā)射亂序執(zhí)行結(jié)構(gòu);1個定點單元和1個訪存單元;采用交叉開關(guān)和多級AMBA總線橋進行片內(nèi)的互連

  高速緩存一級指令cache和數(shù)據(jù)cache各8KB

  內(nèi)存控制器1個32/16位DDR2-266控制器

  音視頻支持1920*1080/60fps的LCD控制器;AC97音頻控制器

  I/OUSB2.0/1.1*1;GMAC*2;I2C、CAN;SPI、NAND;UART*12、RTC、PWM、GPIO*62等I/O控制器

  制造工藝130nmCMOS工藝

  封裝17mm*17mmBGA封裝,256個引腳

  功耗<0.5W

  龍芯2F

  主頻800MHz

  微體系結(jié)構(gòu)集成64位超標(biāo)量處理器核,該處理器核具有如下特點:支持MIPSIII指令集;9級超流水線結(jié)構(gòu);四發(fā)射亂序執(zhí)行結(jié)構(gòu);2個定點單元、2個浮點單元和1個訪存單元

  高速緩存一級指令cache和數(shù)據(jù)cache各64KB;二級cache512KB

  內(nèi)存控制器集成72位DDR1/2-667控制器,支持ECC校驗

  高速I/O無

  其它I/O集成PCI、LocalIO、GPIO等I/O控制器

  制造工藝90nmCMOS工藝

  封裝27mm*27mmBGA封裝,452個引腳

  功耗<5W@800MHz支持動態(tài)降頻

  龍芯2G

  主頻900MHz-1GHz

  微體系結(jié)構(gòu)集成3-4個64位超標(biāo)量處理器核,每個處理器核具有如下特點:支持MIPS64指令集及龍芯擴展指令集;9級超流水線結(jié)構(gòu);四發(fā)射亂序執(zhí)行結(jié)構(gòu);2個定點單元、2個浮點單元和1個訪存單元;采用交叉開關(guān)進行核間互連

  高速緩存每個處理器核的一級指令cache和數(shù)據(jù)cache各64KB多個處理器核通過交叉開關(guān)共享4MB的二級cache

  內(nèi)存控制器集成兩個64位DDR2/3-800控制器

  高速I/O集成一個HyperTransport控制器,帶寬達到6.4GB/s

  其它I/O集成LPC、SPI、UART、GPIO等I/O控制器

  制造工藝65nmCMOS工藝

  封裝31mm*31mmBGA封裝,741個引腳

  功耗<15W@1GHz支持動態(tài)降頻

  龍芯3A

  主頻1GHz

  微體系結(jié)構(gòu)集成4個64位超標(biāo)量處理器核,每個處理器核具有如下特點:支持MIPS64指令集及龍芯擴展指令集;9級超流水線結(jié)構(gòu);四發(fā)射亂序執(zhí)行結(jié)構(gòu);2個定點單元、2個浮點單元和1個訪存單元;采用交叉開關(guān)進行核間互連;通過HT接口進行片間可伸縮互連

  高速緩存每個處理器核的一級指令cache和數(shù)據(jù)cache各64KB四個處理器核通過交叉開關(guān)共享4MB的二級cache

  內(nèi)存控制器集成兩個72位DDR2/3-800控制器,支持ECC校驗

  高速I/O集成兩個HyperTransport控制器,帶寬達到12.8GB/s,支持兩個處理器無縫互連

  其它I/O集成PCI控制器以及LPC、SPI、UART、GPIO等I/O控制器

  制造工藝65nmCMOS工藝

  封裝40mm*40mmBGA封裝,1121個引腳,與龍芯3B引腳兼容

  功耗<15W@1GHz支持動態(tài)降頻

  龍芯3B

  是首款國產(chǎn)商用8核處理器,主頻達到1GHz,支持向量運算加速,峰值計算能力達到128GFLOPS,具有很高的性能功耗比。龍芯3B主要用于高性能計算機、高性能服務(wù)器、數(shù)字信號處理等領(lǐng)域。

  主頻1GHz

  微體系結(jié)構(gòu)集成8個64位超標(biāo)量處理器核,每個處理器核具有如下特點:支持MIPS64指令集及龍芯擴展指令集;9級超流水線結(jié)構(gòu);四發(fā)射亂序執(zhí)行結(jié)構(gòu);2個定點單元、2個浮點單元和1個訪存單元;每個浮點單元支持256位向量運算;采用交叉開關(guān)進行核間互連;通過HT接口進行片間可伸縮互連

  高速緩存每個處理器核的一級指令cache和數(shù)據(jù)cache各64KB八個處理器核通過交叉開關(guān)共享4MB的二級cache

  內(nèi)存控制器集成兩個DDR2/3-800控制器

  高速I/O集成兩個HyperTransport控制器,帶寬達到12.8GB/s,支持多個處理器無縫互連

  其它I/O集成PCI控制器以及LPC、SPI、UART、GPIO等I/O控制器

  制造工藝65nmCMOS工藝

  封裝40mm*40mmBGA封裝,1121個引腳,與龍芯3A引腳兼容

  功耗<50W@1GHz支持動態(tài)降頻

  龍芯3B1500

  龍芯3B1500是國產(chǎn)商用32納米8核處理器,最高主頻可達1.5GHz,支持向量運算加速,最高峰值計算能力達到192GFLOPS,具有很高的性能功耗比。龍芯3B1500主要用于高端桌面計算機、高性能計算機、高性能服務(wù)器、數(shù)字信號處理等領(lǐng)域。

  主頻1.2GHz-1.5GHz

  微體系結(jié)構(gòu)集成8個64位超標(biāo)量處理器核,每個處理器核具有如下特點:

  支持MIPS64指令集及龍芯擴展指令集;

  9級超流水線結(jié)構(gòu);

  四發(fā)射亂序執(zhí)行結(jié)構(gòu);

  2個定點單元、2個浮點單元和1個訪存單元;

  每個浮點單元支持256位向量運算;

  采用交叉開關(guān)進行核間互連;

  通過HT接口進行片間可伸縮互連

  高速緩存64KB私有一級指令cache和數(shù)據(jù)cache

  128KB私有二級cache

  8個處理器核共享8MB的三級cache

  內(nèi)存控制器集成兩個72位DDR2/3控制器,支持ECC校驗

  高速I/O集成兩個HyperTransport2.0控制器

  其它I/O集成PCI控制器以及LPC、SPI、UART、GPIO等I/O控制器

  制造工藝32nmCMOS工藝

  封裝40mm*40mmBGA封裝,1121個引腳,與龍芯3A功能引腳兼容,電源引腳部分有差異

  功耗30W@1.2GHz典型工作模式

  40W@1GHz向量工作模式

產(chǎn)品意義

  有了龍芯,我們可以開發(fā)自己的服務(wù)器、路由器,甚至軍工產(chǎn)品。

  世界工廠的困惑

  眾所周知,中國目前已經(jīng)成為名副其實的“世界工廠”,到過“珠三角”、“長三角”的讀者,特別是在此兩地工廠工作過的應(yīng)該有切身感受。眾多外資企業(yè)將生產(chǎn)過程的低端部分----主要是加工和組裝環(huán)節(jié)轉(zhuǎn)移到中國,這些低端環(huán)節(jié)耗費勞動力多,勞動強度大,但附加值很低。

  電腦業(yè)界赫赫有名的羅技鼠標(biāo),生產(chǎn)工廠設(shè)在蘇州,每年向美國運送2000萬個貼著“中國制造”標(biāo)簽的鼠標(biāo),每只在美國的售價約為40美元。在這一價格中,羅技拿8美元,分銷商和零售商拿15美元,另外14美元進入零部件供應(yīng)商的腰包,中國從每只鼠標(biāo)中僅能拿到3美元,而且工人工資、電力、交通和其他開支全都包括在這3美元里!

  站在電子愛好者角度看,鼠標(biāo)的制造有何難?難就難在羅技能將小小鼠標(biāo)產(chǎn)業(yè)做得這么大,關(guān)鍵在于其知識產(chǎn)權(quán)和品牌。說得極端一點,小小的CPU芯片,動輒成百上千甚至上萬元一顆,其主要材料無非是一點金屬和可從沙子中提煉的硅,但是不掌握CPU設(shè)計技術(shù)、芯片制造技術(shù),我們又能有何選擇?

  對PC產(chǎn)業(yè)來講,包括聯(lián)想、方正這樣的大企業(yè)利潤也是相當(dāng)?shù)偷?,主要原因就是我們買別人的芯片來組裝,只是一個組裝工廠而已。而且,在國際CPU巨頭AMD與英特爾的明爭暗斗中,中國PC廠商無論怎樣都掩蓋不了“看他人臉色”的尷尬處境,既要哄著占有份額優(yōu)勢的英特爾,又不敢得罪價格占優(yōu)的AMD,而這一切都緣于我們無“芯”可挑大梁,緣于中國PC業(yè)長期以來沒有占據(jù)技術(shù)的制高點。

  “龍芯”的市場前景

  進口一顆服務(wù)器用的CPU芯片(至強MP)價格高達幾萬元,占到服務(wù)器成本的70%以上,據(jù)統(tǒng)計,光進口芯片國外大公司每年就能從中國賺走一百多億美元。如果“龍芯”可以替代,市場前景不可限量。

  為了促使“龍芯”能盡快得到整機制造企業(yè)和系統(tǒng)設(shè)計企業(yè)的應(yīng)用,使其順利進入產(chǎn)業(yè)鏈,促進產(chǎn)業(yè)化,國內(nèi)MII-MS嵌入式軟件實驗室為“龍芯二號”CPU開發(fā)面向的BSP軟件支持包,使“龍芯”能支持微軟公司的WindowsCE這一嵌入式操作系統(tǒng)。“龍芯2號”電腦亮相國際市場,基于Linux,含40GB硬盤、256MB內(nèi)存,具有上網(wǎng)、收發(fā)郵件、辦公文本處理、音視頻播放等基本功能,相當(dāng)于1GHz的奔3臺式機,售價僅150美元。但僅僅只有低價是不夠的。CPU的產(chǎn)業(yè)鏈非常長,并不是說做出了一個產(chǎn)品馬上就可以形成一個產(chǎn)業(yè),就能夠大量的賣出去。它需要操作系統(tǒng)、應(yīng)用軟件、硬件設(shè)計的配合。產(chǎn)業(yè)化的主要手段就是建立產(chǎn)業(yè)聯(lián)盟,在北京有龍芯公司,在重慶、江蘇、廣東等地都有“龍芯“的基地。“龍芯”的應(yīng)用不僅僅限于電腦,對國防工業(yè),網(wǎng)絡(luò)服務(wù)器、路由器、游戲機,特別在中國廣大的消費市場有著廣闊的發(fā)展前景。

  龍芯讓人人都用得起電腦,當(dāng)初龍芯一個研發(fā)宗旨是信息化要為廣大人群服務(wù),因此龍芯一直注重在低成本方面的突破。雖然電腦價格越來越低,但是對于廣大的中國市場來說,仍然太貴,特別是農(nóng)村和西部市場。龍芯電腦的推出為填平數(shù)字鴻溝提供了可能性,有廣闊的前景。

研發(fā)

  保衛(wèi)國家信息安全的必經(jīng)之路

  在如今的芯片市場上,國際巨頭壟斷,自主研發(fā)可謂困難重重。胡偉武告訴記者,研發(fā)“龍芯”的初衷就是要打破國際壟斷。

  在胡偉武看來,高性能通用CPU不是一般的集成電路,它是信息產(chǎn)業(yè)的基礎(chǔ)部件,也是武器裝備的核心器件。它對國家安全都有著極其重要的戰(zhàn)略意義??墒?,當(dāng)前國際的芯片市場受到重重壟斷,包括技術(shù)壟斷、知識產(chǎn)權(quán)壟斷、市場壟斷等等。

  “我們現(xiàn)在面臨的狀況和老一輩科學(xué)家創(chuàng)造兩彈一星時有所不同:那個時候我們是在封鎖的情況下打破封鎖,而今天我們是在開放的情況下打破壟斷。”胡偉武向記者分析道。

  據(jù)記者了解,龍芯項目最初由中國科學(xué)院發(fā)起,而這個項目發(fā)起的初衷就是要面向國家戰(zhàn)略需求、面向國際科技的前沿。因此,龍芯的誕生就是要保障國家信息安全、支撐信息產(chǎn)業(yè)的發(fā)展。

  缺乏信心成最大難題

  所謂的“缺乏信心”并不是龍芯研發(fā)團隊的自信缺失,而是在國際巨頭只手遮天的產(chǎn)業(yè)形勢下,外界輿論所表現(xiàn)出的對龍芯的信心不足。

  胡偉武在采訪中告訴記者,幾年來,龍芯發(fā)展的過程可以分為不同的階段。每個階段,龍芯所面對的困難在都各有不同,但貫穿始終的最大困難就是外界對龍芯研發(fā)的質(zhì)疑態(tài)度。

  2001年到2002年是龍芯從無到有的階段。那個時候,可以說,我國業(yè)界對芯片技術(shù)一無所知,而且沒有人可以請教,一切都要從零開始。當(dāng)時,胡偉武帶領(lǐng)團隊成員去國外請專家、請老師授課。這一時期,很多人都質(zhì)疑中國到底要不要自己做芯片——國外大企業(yè)每年投入幾十億美元,有幾千人的研發(fā)隊伍,而龍芯研發(fā)團隊只有幾十人,經(jīng)費也只有幾千萬而已,如何做出高性能CPU呢?直到龍芯一號誕生,胡偉武和他的團隊采用用事實證明了中國人有能力做自己的通用CPU。

  第二個階段,是從2003年到2005年,這是個技術(shù)持續(xù)追趕的階段。雖然龍芯已經(jīng)解決了能不能做、要不要做的問題,但當(dāng)時龍芯芯片的各方面性能還都與國際水平相去甚遠(yuǎn)。所以,又有很多人跳出來質(zhì)疑龍芯能不能做好?“屋漏偏逢連夜雨”:恰好2004--2005年間又發(fā)生了“漢芯”造假事件。于是,輿論導(dǎo)向也就看似很“自然”地開始懷疑龍芯是假的了。

  而實際上,龍芯從2003年到2005年,經(jīng)歷3年的時間,平均每年性能提高3倍,到“十五”末的時候達到當(dāng)時中低檔國際主流芯片的性能,做到初步可用。打贏了“能不能做好”這場“戰(zhàn)役”。

  初步涉水產(chǎn)業(yè)化

  進程第三個階段,是從2006年到2009年。這3年,是龍芯芯片技術(shù)進一步改進和產(chǎn)業(yè)化探索的階段。盡管在技術(shù)上取得了突破、在部分性能指標(biāo)上也已經(jīng)達到了世界先進水平,但是龍芯產(chǎn)品是不是能賣得出去、有沒有用,又成為了擺在龍芯人面前的又一難題。

  胡偉武認(rèn)為,龍芯的產(chǎn)業(yè)化,不是傳統(tǒng)意義上一個產(chǎn)品的產(chǎn)業(yè)化,也不是一條產(chǎn)業(yè)鏈的建設(shè),而是自主可控的信息產(chǎn)業(yè)體系的建設(shè)。在這方面,當(dāng)時還沒有任何經(jīng)驗。

  據(jù)了解,解放初期,國家通過政策性規(guī)劃完成了工業(yè)產(chǎn)業(yè)體系的建設(shè)。但在市場如此開放的今天,以企業(yè)為主體來建設(shè)一個產(chǎn)業(yè)體系,龍芯還是第一個。當(dāng)時,龍芯用了幾年的時間在江蘇建立了產(chǎn)業(yè)基地,嘗試與一些企業(yè)合作逐漸掌握市場運行的規(guī)律,積累經(jīng)驗,在一些行業(yè)和領(lǐng)域也取得了很多突破。例如,2009年年底江蘇省政府采購了15萬套龍芯筆記本,目前已經(jīng)成功地在江蘇省中小學(xué)完成了6萬套的布點。

  從2010年起,龍芯正式以公司的形式運行,開始了正真正意義上的規(guī)模產(chǎn)業(yè)化發(fā)展。這個階段,龍芯能不能走向規(guī)模產(chǎn)業(yè)化又成了外界輿論最大的疑慮。當(dāng)然,這個問題也得通過實踐來回答。而對于龍芯來說,這個階段最大的困難便是科研與應(yīng)用如何良好的結(jié)合。

  龍芯產(chǎn)業(yè)化影響深遠(yuǎn)

  胡偉武說,龍芯芯片的研發(fā)成功在我國計算機發(fā)展史上具有里程碑式的意義,是我國研制自主知識產(chǎn)權(quán)的高性能通用CPU的典范之作,將為國家安全和國防事業(yè)發(fā)揮重大的、不可替代的作用。

  首先,龍芯的研發(fā)成功是增強了國人的自信心,向世界證明了中國人也可以自己做芯片?,F(xiàn)在,龍芯已經(jīng)被寫入九年制義務(wù)教育的教科書,記錄了龍芯歷史性貢獻。另外,龍芯也被寫入普通高等教育《大學(xué)計算機基礎(chǔ)》教材,在講計算機文化時,龍芯已經(jīng)和Intel一樣,成為了授課內(nèi)容。

  其次,龍芯對于國家安全保障的作用也得到了充分體現(xiàn)。龍芯開始進行產(chǎn)業(yè)化伊始,就面向國家的信息安全需要,這是龍芯最根本的使命。到目前為止,龍芯在安全領(lǐng)域的應(yīng)用已經(jīng)全面展開。 

  再其次,是龍芯對整個信息產(chǎn)業(yè)的支撐作用。通用CPU就好比工業(yè)的鋼鐵、石油。沒有鋼鐵和石油,工業(yè)就談不上存在。信息產(chǎn)業(yè)也一樣——沒有自主的CPU,就談不上信息產(chǎn)業(yè)體系。但是,CPU與鋼鐵、石油還有不同之處,就在于它的創(chuàng)新性要求很強。而且,它是一個很龐大的體系。另外,CPU非常依賴產(chǎn)業(yè)內(nèi)的“生態(tài)環(huán)境”,同時又可以控制這個“生態(tài)環(huán)境”。如今,我國80%的信息產(chǎn)業(yè)都是建立在他人的芯片平臺基礎(chǔ)上的,而龍芯的誕生,特別是龍芯正在進行的規(guī)模產(chǎn)業(yè)化的建設(shè),將為我國自主可控的信息產(chǎn)業(yè)發(fā)展起到了強有力的支撐作用。

未來展望

  中國工程院院士、聯(lián)想漢卡發(fā)明人倪光南指出:IT核心技術(shù)的掌握關(guān)系到國家的信息安全,因此,IT核心技術(shù)中國非做不可。

  一位網(wǎng)友在搜狐博客網(wǎng)上這樣寫到:很希望看到中國自己的CPU,不管它的性能怎樣,只要它上市,我就會買。身為開發(fā)人員,能夠深深地理解作為中國的開發(fā)人員所擔(dān)負(fù)的歷史責(zé)任。雖然沒有機會加入到CPU的開發(fā)中,那就在他們辛勤工作的時候默默支持吧!多么樸實的言語,但展現(xiàn)的卻是國人高昂的愛國激情!

  “龍芯”的問世不僅僅在于中國自主研發(fā)出了自己的CPU產(chǎn)品,其更深層次的意義在于它穿透了困擾在中國科技人員心中的一團迷霧,憑借著自身的技術(shù)研發(fā)實力,中國同樣可以自己研發(fā)生產(chǎn)出被國外壟斷的產(chǎn)品。目前有不少年輕人,對國貨表現(xiàn)出一貫的不信任,尤其數(shù)碼產(chǎn)品等。日本人就很善于引進外國技術(shù),然后學(xué)習(xí)、模仿、創(chuàng)新,中國人同樣也有這種精神。中國既然可以在艱難條件下研發(fā)兩彈一星,在航天領(lǐng)域與美國、歐洲并肩前進,那么在芯片研制領(lǐng)域也一定可以做到!

  “龍芯”是我們自己的孩子,我們要用心去愛護他。雖然他現(xiàn)在還不如Intel,但至少目前還沒有幾個國家能夠生產(chǎn)出這種暫時不如Intel的芯片!這就是我們的驕傲!回想霍元甲時代,作為香港特區(qū)一位電子工作者,筆者再次感慨萬千。我們是龍的傳人,堅信“龍芯”的成功是必然的!我們期待著“龍芯”帶給我們更多、更大的驚喜!

 


內(nèi)容來自百科網(wǎng)