智見|專訪周鴻祎:頭部公司才做大模型大部分人得專注場景
分類: 最新資訊
育兒詞典
編輯 : 育兒知識
發(fā)布 : 03-27
閱讀 :278
出品|科技《智見訪談》作者|趙芙瑤編輯|丁廣勝大腦是如何工作的?我們能否設(shè)計(jì)一個(gè)機(jī)器來模擬大腦?這是1956年,信息論創(chuàng)始人克勞德·香農(nóng)與發(fā)明Lisp語言的約翰·麥卡錫在《自動(dòng)機(jī)研究》開篇提出的問題。如今,Chat GPT使人工智能技術(shù)在擬真度和功能維度方面達(dá)到新高度,人工智能似乎與真正的大腦之間的距離開始無限接近。生成式人工智能帶來的全面智能化是一場深刻的革命,企業(yè)的治理運(yùn)行邏輯也或?qū)㈦S之發(fā)生深刻變革。在此背景下,互聯(lián)網(wǎng)巨頭們加碼AIGC,紛紛表示想要打造“中國版ChatGPT”。放眼望去,清華系智譜AI宣布開源ChatGLM-6B大模型,百度也終于發(fā)布“文心一言”大模型。基于這個(gè)話題,360公司創(chuàng)始人、董事長兼CEO周鴻祎高度關(guān)注,在兩會(huì)期間,他將“國內(nèi)AI大模型的技術(shù)創(chuàng)新和創(chuàng)新模式”寫進(jìn)提案。在周鴻祎看來,人工智能會(huì)帶來一場工業(yè)革命,可以重塑甚至顛覆眾多企業(yè)的現(xiàn)有模式。“GPT已經(jīng)給大家相當(dāng)于指明了方向,大力出奇跡。”周鴻祎在接受科技專訪時(shí)指出ChatGPT具有無限可能,并對于ChatGPT的未來發(fā)展展開大膽想象。談賦能傳統(tǒng)行業(yè):ChatGPT可重塑企業(yè)生態(tài)鏈今年政府工作報(bào)告提出,要加快傳統(tǒng)產(chǎn)業(yè)和中小企業(yè)數(shù)字化轉(zhuǎn)型,著力提升高端化、智能化、綠色化水平。以“專精特新”為代表的中小企業(yè)是數(shù)字經(jīng)濟(jì)發(fā)展的主力軍,然而在數(shù)字化轉(zhuǎn)型的浪潮中,許多中小企業(yè)面臨著成本受限、轉(zhuǎn)型能力不足等挑戰(zhàn)。作為一名曾經(jīng)的創(chuàng)業(yè)者,周鴻祎非常能理解中小企業(yè)以及小微企業(yè)的艱辛,他認(rèn)為在中小微企業(yè)轉(zhuǎn)型數(shù)字化過程中真正做到一個(gè)也不能少,才能實(shí)現(xiàn)數(shù)字化戰(zhàn)略的共同富裕。“數(shù)字化浪潮來的時(shí)候,我曾說所有的行業(yè)值得重做一遍。實(shí)際上重做的難度還是很高的,要采集大數(shù)據(jù),建立自己的大數(shù)據(jù)中臺,做大數(shù)據(jù)分析模型,用數(shù)據(jù)來進(jìn)行決策,將所有傳感器都物聯(lián)網(wǎng)化,這樣成本很高。”周鴻祎道出了傳統(tǒng)企業(yè)的轉(zhuǎn)型難題。同時(shí)周鴻祎指出,ChatGPT無疑為企業(yè)提供了一條新的思路。“現(xiàn)在很多企業(yè)如果用ChatGPT進(jìn)行生態(tài)鏈重塑就比較容易,只需購買SaaS服務(wù),并把SaaS服務(wù)跟現(xiàn)在已有的業(yè)務(wù)流程進(jìn)行結(jié)合。寫稿時(shí)如果覺得江郎才盡,可以和ChatGPT聊聊天,或許會(huì)腦洞大開。”周鴻祎堅(jiān)信,人工智能重塑各個(gè)行業(yè)、各個(gè)企業(yè)。目前周鴻祎要求其公司每個(gè)團(tuán)隊(duì)都得做APP的部署,無論是To B、To C都應(yīng)該涵蓋。假設(shè)擁有了強(qiáng)大的大腦后臺,將云服務(wù)引到APP中,軟件一定會(huì)煥然一新,而ChatGPT無疑是產(chǎn)業(yè)革命的加速器。談打造中國版ChatGPT:產(chǎn)學(xué)研需“珠聯(lián)璧合”ChatGPT背后最為核心的技術(shù),是深度學(xué)習(xí)的多層變換器Transformer、即GPT中的“T”。其模型也并非完全原創(chuàng),但是最終產(chǎn)生了1+1>2的效果。目前,對于前沿科技領(lǐng)域,國內(nèi)很多研究機(jī)構(gòu)還處于追隨模仿階段。周鴻祎指出國內(nèi)企業(yè)最終還是要靠自主創(chuàng)新,在學(xué)術(shù)上有所突破。“前沿的人工智能模型和算法,很多都不是我們原創(chuàng)的,這需要科研機(jī)構(gòu)的努力。同時(shí),單單靠研究機(jī)構(gòu)也不行,必須效仿OpenAI與微軟的模式,讓研究機(jī)構(gòu)與產(chǎn)業(yè)化公司深度合作。”周鴻祎認(rèn)為,人工智能大模型的成功一部分是技術(shù),一部分是產(chǎn)品體驗(yàn),還有一部分是工程化,其中存在許多環(huán)節(jié),包括內(nèi)容的調(diào)度、數(shù)據(jù)的篩選、工程師的標(biāo)注、人工的訓(xùn)練。而研究者往往容易忽視工程化,這是錯(cuò)誤的做法。在他看來,而這需要進(jìn)行結(jié)合與互補(bǔ)。“搞工程化的公司有時(shí)往往又覺得搞研究的人想得太理想主義,所以我認(rèn)為這次人工智能大模型的成功應(yīng)該說是微軟和OpenAI之間珠聯(lián)璧合的合作起到了決定性作用。微軟提供算力、工程師,幫其解決工程化的問題,而產(chǎn)業(yè)化公司比較擅長的是用戶體驗(yàn)。此外因?yàn)榇竽P陀?xùn)練的成本很高,如果找不到商業(yè)模式,是難以為繼的,而這也是產(chǎn)業(yè)化公司擅長的。”周鴻祎指出了二者各自的優(yōu)勢,同時(shí)也挖掘出了其合作模式。在周鴻祎看來,微軟承接了許多屬于產(chǎn)業(yè)化公司擅長的工作,使OpenAI可以專注于技術(shù)研究,雙方在資本上又進(jìn)行了很好的結(jié)合,這給予了我們啟發(fā),中國可以將大學(xué)、國家實(shí)驗(yàn)室、科研機(jī)構(gòu)、科研體系和互聯(lián)網(wǎng)公司、產(chǎn)業(yè)公司結(jié)合起來,通過合作的方式來推進(jìn)。“別人已經(jīng)領(lǐng)先了,我們不能再把別人踩過的坑再踩一遍。”周鴻祎感嘆道。他認(rèn)為首先可以建立大型科技企業(yè)+重點(diǎn)科研機(jī)構(gòu)的產(chǎn)研協(xié)同創(chuàng)新模式,打造中國的“微軟+Open AI”組合引領(lǐng)大模型技術(shù)攻關(guān);其次可以支持設(shè)立多個(gè)國家級人工智能大模型的長期開源項(xiàng)目,打造開源眾包的開放創(chuàng)新生態(tài)。建立大型科技企業(yè)+重點(diǎn)科研機(jī)構(gòu)為龍頭,通過開源、合作、眾包和生態(tài)的創(chuàng)新模式,引導(dǎo)高校、科研機(jī)構(gòu)和創(chuàng)新型企業(yè)形成多個(gè)技術(shù)路線的創(chuàng)新生態(tài)群。這樣一來,可以降低錯(cuò)誤風(fēng)險(xiǎn)和防止技術(shù)壟斷風(fēng)險(xiǎn),避免其變成新時(shí)代的數(shù)字鴻溝。談與國外差距:原創(chuàng)性有差距,兩年有望趕上國外“我覺得中國和國外的差距沒有那么大,比光刻機(jī)芯片差距都要小很多,主要原因是這方面的論文都是開放的,很多模型算法原來都是開源的,相當(dāng)于我們有基礎(chǔ)。GPT已經(jīng)給大家相當(dāng)于指明了方向,大力出奇跡。但是,我覺得這里有很多細(xì)節(jié)的技術(shù)問題,比如灌輸知識是容易的,但能力和推理能力,包括各種實(shí)際技能的訓(xùn)練較為復(fù)雜。所以我認(rèn)為大概需要兩年左右的時(shí)間,國內(nèi)的水平就可以趕上來。”談及我國的AI企業(yè)在資金、人才、底層技術(shù)等關(guān)鍵環(huán)節(jié)與國外存在的差距,周鴻祎這樣回答道。周鴻祎還提出,中國和微軟、Google的差距,從模仿角度來看差距不大,從原創(chuàng)角度差距仍然存在。“我們面臨幾個(gè)不利的條件,就是我國缺乏開源的傳統(tǒng),它里面用了很多模型都是前面的公司開源的,沒有前面的開源就沒有在前人肩膀上的積累,每個(gè)公司都要從黑暗中摸索,這對國家整個(gè)產(chǎn)業(yè)發(fā)展速度是不利的。這么牛的技術(shù),也確實(shí)不應(yīng)該被壟斷在一兩家公司手里。”他還指出我國目前存在的一些難點(diǎn)。他指出,為了實(shí)現(xiàn)對GPT的超越,需要使用更多的數(shù)據(jù),而不僅僅是開源數(shù)據(jù)集。這包括大量的雜志、期刊和圖書。公共數(shù)據(jù)是非常重要的,因?yàn)镚PT對時(shí)效性的要求并不高,它可以使用很早以前的書籍或文章。但周鴻祎也指出數(shù)字化的問題是一個(gè)難點(diǎn):“如果大量的中文圖書沒有數(shù)字化,或者沒有一定版權(quán)的授予,這個(gè)版權(quán)授予如何進(jìn)行、國家如果沒有政策支持,那么數(shù)字化的難度會(huì)更大。”除了版權(quán)之外,周鴻祎認(rèn)為互聯(lián)網(wǎng)的信息也非常重要,互聯(lián)網(wǎng)有上萬億個(gè)網(wǎng)頁,其中有很多都是電子垃圾,這就需要搜索引擎進(jìn)行調(diào)度、處理、過濾和清洗。“但是中國出現(xiàn)一個(gè)怪現(xiàn)象,喬布斯發(fā)明了APP,大家用習(xí)慣了就不怎么用網(wǎng)站了,但是美國還有一個(gè)傳統(tǒng),所有的APP背后還有一個(gè)Web版本,還是保持了Web化的瀏覽體驗(yàn),這樣的話這些不涉及用戶隱私的數(shù)據(jù)可以被抓取可以用來做訓(xùn)練,但在中國所有的信息都被APP分割了,APP人為的將互聯(lián)網(wǎng)分割成了各種信息孤島。如果你的數(shù)據(jù)我拿不到,我的數(shù)據(jù)也不給你,最后大家訓(xùn)練出來的能夠真正超越嗎?我覺得會(huì)比較難。”同時(shí)周鴻祎也規(guī)劃了一條企業(yè)可以選擇的路徑,他認(rèn)為打造生態(tài)至關(guān)重要,ChatGPT目前表面上來看,是打造了一個(gè)聊天機(jī)器人、個(gè)人助理來幫助大家更好的使用工具。而實(shí)際上它做了一項(xiàng)工作:秘密挑選了一百家專業(yè)公司并扶植其做專業(yè)的垂直應(yīng)用,這一百家公司大部分均為創(chuàng)業(yè)公司。“頭部企業(yè)才需要搞大模型,大部分企業(yè)只需要在大模型的基礎(chǔ)上,結(jié)合自己的行業(yè)場景、專業(yè)需求,利用大模型提供AI的能力來賦能自己就可以了。所以,對于很多創(chuàng)業(yè)企業(yè)應(yīng)該是一個(gè)蓬勃發(fā)展的機(jī)會(huì)。”周鴻祎向科技表示。同時(shí)周鴻祎也強(qiáng)調(diào),ChatGPT被稱為通用人工智能是因?yàn)樗鼧?gòu)建了一個(gè)通用的知識基礎(chǔ),可以為不同的行業(yè)和應(yīng)用場景提供支持,而不是只限于某一個(gè)垂直領(lǐng)域。這也是它的產(chǎn)業(yè)革命的價(jià)值所在。雖然在中文語料方面,ChatGPT的中文表現(xiàn)不如英文表現(xiàn)好,但這是因?yàn)橹形恼Z料的比例非常低,大約只有百分之幾。這意味著要訓(xùn)練更好的中文模型,需要更多的中文語料。展望未來,周鴻祎認(rèn)為在追趕美國的過程中,我們要先把自己的“疑難雜癥”解決,如果想在一片土壤上長出幾棵蒼天大樹,要長出生態(tài),就先要把土壤環(huán)境機(jī)制創(chuàng)造好。