AGI編程,將是我們從移動互聯(lián)網(wǎng)時(shí)代,跨越到大模型時(shí)代的重要一步。
在繪畫、寫文章、創(chuàng)作視頻之后,AGI應(yīng)用的另一大場景是:編程。
曾經(jīng)大家認(rèn)為編程有很高門檻,但在AGI時(shí)代,它在變成人人觸手可及的技術(shù),越來越多的AI編程工具,讓不會代碼的普通人也能輕松制作App。
我們?nèi)绾螖[脫基于移動互聯(lián)網(wǎng)時(shí)代的想象,展開大模型時(shí)代新的可能性?未來是不是人人都能成為AI程序員,創(chuàng)造專屬于自己的「個(gè)性化應(yīng)用」?
對于這些問題,AIGCode創(chuàng)始人宿文在極客公園IF2025創(chuàng)新大會上,給出了自己的答案。
宿文認(rèn)為,在AGI的賦能下,AGI代碼可以把應(yīng)用帶入更有「個(gè)性化」的階段,讓每個(gè)用戶可以實(shí)現(xiàn)自己小眾但精準(zhǔn)的需求,小團(tuán)隊(duì)也可以降低成本,快速迭代。這是宿文眼中編程的終極場景。
在宿文看來:
·互聯(lián)網(wǎng)時(shí)代創(chuàng)造的應(yīng)用、平臺,并不生產(chǎn)任何內(nèi)容,只完成內(nèi)容的聚合和分發(fā)。
·在大模型時(shí)代,大模型只有一個(gè)核心功能:在底層幫大家生成內(nèi)容。
·大模型時(shí)代剛剛拉開序幕,大模型的鏈條會長什么樣,每個(gè)從業(yè)者還在探索,但這條鏈條可能不會長成上個(gè)時(shí)代的樣子。
·AI編程將重塑軟件開發(fā)行業(yè),軟件開發(fā)「又好又快又便宜」可以同時(shí)實(shí)現(xiàn)。
·在大模型時(shí)代,沒有超級應(yīng)用,只有超級智能。
以下是AIGCode創(chuàng)始人宿文在極客公園IF2025創(chuàng)新大會上的現(xiàn)場演講實(shí)錄,由極客公園整理。
宿文在極客公園IF2025創(chuàng)新大會上進(jìn)行演講|圖片來源:極客公園
從Copilot到Autopilot
即將過去的2024年,大模型賽道引發(fā)了許多討論,AI編程是其中一個(gè)繞不開的話題。
大家都會說程序員被大模型改造得很深刻,全世界程序員群體有七八千萬,占世界人口1%左右。這么厲害的軟件代碼改造技術(shù),怎么讓其他99%的人使用呢?
我們可以舉一個(gè)例子,今天中午極客公園鵬總突然說這個(gè)活動辦得很好,除了線上買票、線上收費(fèi),咱們線上直播行不行?會務(wù)組小伙伴崩潰了,去哪找直播管理平臺,去哪找SaaS,如果自己定需求,自己去做開發(fā),至少幾個(gè)周、幾個(gè)月時(shí)間。
為了方便大家了解AIGCode的產(chǎn)品AutoCoder,我們把這個(gè)平臺給大家看一下。
AIGcode演示界面|圖源:AGIcode
這個(gè)產(chǎn)品完全面向不會編程的人群。
另外很重要的點(diǎn),相比大家現(xiàn)在拿到的類似產(chǎn)品,主要圍繞前端,但是AIGCode能夠把后端和數(shù)據(jù)庫一體化交付給大家,能交付出一個(gè)完整的軟件工程。
做這個(gè)事的源頭,跟我上一段創(chuàng)業(yè)有關(guān)系。我上段創(chuàng)業(yè)是做軟件,有一個(gè)比較大的痛點(diǎn)是效率,我們經(jīng)常提出一個(gè)需求,程序員要做幾周甚至幾個(gè)月,我們看到很多很好的技術(shù)棧,字節(jié)、阿里用得很好,但我們程序員用不起來,而且程序員成本很貴。
所以做軟件,怎么做得又快又好又便宜,這是每個(gè)行業(yè)都面臨的難題,不可能在一個(gè)維度上去解決。然而大模型來了,又好又快又便宜可以實(shí)現(xiàn)了。
當(dāng)然實(shí)現(xiàn)過程中,目前主要有兩類解決方案:一類就是Copilot,就像名字一樣的,幫程序員做輔助駕駛。另外就是我們想做的Autopilot這樣的產(chǎn)品。
Copilot,目前主要還是圍繞程序員工作場景在IDE里面做代碼補(bǔ)齊,中國沒有IDE,甚至全球最主要的IDE 80%、90%的市場都在微軟手里,作為初創(chuàng)公司很難在生態(tài)里PK,只能繞開這個(gè)很大的生態(tài)競爭。我們在Web端做IDE Free的產(chǎn)品,端到端去做。我們用戶會完全不一樣,我們把用戶群體從1%放大到10%、20%都有可能。
目前大家所用到的模型和Copilot產(chǎn)品,主模型能夠用上最好的基模,不管海外還是國內(nèi),大家都在使用Deepseek這種水平的基模。要把代碼鏈條優(yōu)化得足夠好,核心的技術(shù)都卡在模型上,所以自研模型不會套殼,不會用Llama去做,我們會有自己的模型架構(gòu)解決這個(gè)問題。
還有很重要一點(diǎn),傳統(tǒng)軟件架構(gòu)跟生成式軟件架構(gòu)不一樣,兩大支柱做了算法和軟件架構(gòu)層面的創(chuàng)新,這是我們兩塊主要的工作。
右面是模型上的工作,核心解決兩個(gè)點(diǎn):又大又準(zhǔn),大的是「大上下文」,而不是后半段做4K窗口的串聯(lián)。另外是新的網(wǎng)絡(luò)結(jié)構(gòu)帶來的收益,還有一塊是在軟件結(jié)構(gòu)的創(chuàng)新。
ChatGPT的火爆正好兩年多,我們其實(shí)站在今天這個(gè)節(jié)點(diǎn)來看,我們很憧憬大模型可以解決很多問題。
今天可以解決的問題主要在寫字和畫畫兩個(gè)場景,很多理科生的的問題,比如數(shù)學(xué)、編程這樣的工作還沒有解決得很好,我們遇到了很多其他問題,比如訓(xùn)練成本、資金、模型本身的泛化能力、訓(xùn)練效率等等。
目前網(wǎng)絡(luò)結(jié)構(gòu)在Transformer往前迭代,去年上半年提出的MOE這種架構(gòu)也在改造整個(gè)大模型,在MOE之后還有MMOE等很多技術(shù)迭代。
我們率先使用PLE架構(gòu),核心是我們能夠在網(wǎng)絡(luò)結(jié)構(gòu)層讓專家或大模型,更有結(jié)構(gòu)化地深度學(xué)習(xí)人類高質(zhì)量樣本。至于樣本不夠用的問題,其實(shí)不會出現(xiàn),因?yàn)槲覀冇泻芏喔哔|(zhì)量的樣本,像論文、代碼這些樣本還沒有被徹底學(xué)到。
為了讓整個(gè)模型可以支撐起完整的代碼生成,模型底層還要配套很強(qiáng)的算法,所以我們自己去做優(yōu)化,包括不同的算力平臺的整合,一體化平臺上的算力加速,我們看到的技術(shù)卡點(diǎn),都解決掉了。
我們自己的模型成果,也不會拿國內(nèi)任何一個(gè)軟柿子去捏,去對比,我們還是拿全球頂尖的團(tuán)隊(duì)的最新版本,最大參數(shù)量去做,我們在泛化指標(biāo)上,是跟主流模型基本平齊的水平。
我們會在接下來三個(gè)季度把13B和33B也發(fā)布出來,給有模型使用能力的團(tuán)隊(duì)使用。
這句話是我們公司的愿景,剛剛主要解釋了上半句,Auto-coding is AGI,我們看起來在解決代碼編程的問題,但是核心問題是:能不能把端到端代替程序員寫完代碼。
Autocoding加速「個(gè)性化」
這問題由AGI模型本身決定,我們發(fā)現(xiàn),無論解決上下文還是網(wǎng)絡(luò)結(jié)構(gòu)、底層優(yōu)化器、算力加速等等問題,都是目前AGI最大的痛點(diǎn),這兩個(gè)問題幾乎是等價(jià)的,AGI和Auto-coding基本上同一個(gè)時(shí)間點(diǎn)到來。
底層邏輯有兩個(gè):一、代碼本身就是一種高質(zhì)量語言,對于模型訓(xùn)練非常重要。另外,我們覺得AGI本身從一個(gè)新技術(shù)的出現(xiàn),到兩年前的ChatGPT進(jìn)入大眾視野,我們對它有很多憧憬,但它解決很多行業(yè)問題還不成熟,所以很多行業(yè)專家或者用戶就會罵街,說這個(gè)工具不成熟,解決不了問題。
但是對于代碼這個(gè)賽道來說,比較幸福的是:我們算法工程師,95%都是程序員出身,因此思路上閉環(huán)很快,自己做得好不好,我們自己心里有數(shù)。
第二點(diǎn)是,這樣的Auto-coding準(zhǔn)備好后,解決問題時(shí),怎么端到端,要打到哪些需求點(diǎn)?
用戶體驗(yàn)上的核心之處:第一個(gè)點(diǎn)是準(zhǔn)確,我們所有需求,怎么達(dá)成底層產(chǎn)品鏈條里的準(zhǔn)確率?今天使用很多Agent類產(chǎn)品,第一個(gè)生成的版本很好,但細(xì)微的需求點(diǎn)沒有辦法實(shí)現(xiàn)。
第二個(gè)點(diǎn)是靈活性,在一個(gè)應(yīng)用的生成過程中,最重要的是要實(shí)現(xiàn)各種各樣個(gè)性化的要求,比如一個(gè)搜索框,能不能實(shí)現(xiàn)得足夠靈活,能跟所有功能邏輯串通。
第三個(gè)點(diǎn)是完整度,這是軟件工程上的工作,要解決工程的安全問題、部署問題。在這些工作做完后,這套方案就會變成基礎(chǔ)設(shè)施,程序員的工作全部用推理算力成本就可以解決。我們想去做的Personal App(個(gè)性化應(yīng)用)就可以實(shí)現(xiàn)。
大家看到這個(gè)場景的時(shí)候可能會說:「我們手機(jī)里裝的都是通用應(yīng)用,我要一個(gè)Personal App做什么呢?」也有很多人問我:「你們要ToB還是ToC?」
其實(shí)一個(gè)新的生產(chǎn)力工具出現(xiàn)時(shí),這些問題都不重要,舉兩個(gè)很有意思的例子:
上周我去云南某城參加一個(gè)會議,會議組織方帶我們?nèi)ゾ皡^(qū),很多人排長隊(duì)在買票,但旁邊有好幾臺自動售票的機(jī)器,我走近一看都開著機(jī),機(jī)內(nèi)裝著Windows系統(tǒng),這時(shí)候如果有一個(gè)管理人員可以提出一個(gè)售票系統(tǒng)的需求,都不需要在當(dāng)?shù)卣页绦騿T,用可以在Windows里部署一套售票管理軟件,排長隊(duì)買票的問題就很好解決。
另外一個(gè)例子,我跟一個(gè)朋友討論播客,我們聽播客很多都依賴于小宇宙這種播客客戶端。在美國,很多主播會在YouTube上有視頻播客的頻道,國內(nèi)很少用視頻的方式做播客,這個(gè)朋友說我們不太想露臉,如果有一個(gè)卡通形象體出鏡,去做視頻播客,主播就會自然舒服很多了。
所以大家會發(fā)現(xiàn),在我們場景里有非常多個(gè)性化應(yīng)用的需求,哪怕是基于一個(gè)通用的平臺,都可以加很多個(gè)性化的功能進(jìn)去,這在編程的終極場景里都可以實(shí)現(xiàn)。
我們在小紅書、知乎或者百度上,想搜索一個(gè)軟件去解決我們一些問題時(shí),本質(zhì)上都是在提需求。如果這樣的需求可以通過自動生成的代碼和應(yīng)用實(shí)現(xiàn),而不需要用戶去找各種各樣的應(yīng)用,找到后還要克制自己的需求。這兩種體驗(yàn)完全不一樣。
大模型的核心功能,究竟是什么?
關(guān)于代碼生成和我們公司要做的事情,介紹到這里就結(jié)束了。接下來我有三個(gè)真話想說:
一、大家一直在追求AGI或者解決AGI問題,是很割裂的。比如很多大佬都會說,整個(gè)大模型目前還處于嬰兒期,但是從2024年初到現(xiàn)在,大家都說今年是Agent元年,但一個(gè)嬰兒期的工具怎么解決那么多問題?
我們經(jīng)常聽到說Scaling Law走到盡頭了,但是囤卡樂此不疲,H100、B200,1萬張,10萬張,大幾十萬張卡,現(xiàn)在大廠甚至開始搞核電站了,包括Ilay最近提到的,預(yù)訓(xùn)練期結(jié)束了,其實(shí)里面沒有什么干貨,主要把樣本學(xué)完,但是還有很多高質(zhì)量樣本,需要結(jié)構(gòu)化輸入進(jìn)整個(gè)網(wǎng)絡(luò)結(jié)構(gòu)里。
所以有什么資源,大家就會依賴什么路徑,對于我們這樣的公司來說,我們看到更多的是網(wǎng)絡(luò)結(jié)構(gòu)層帶來了非常大的紅利。從Transformer出現(xiàn),到前面幾十年,大家對于通用人工智能的追求,都避不開網(wǎng)絡(luò)結(jié)構(gòu)這個(gè)環(huán)節(jié),這一層獲得的收益和待解決的問題更多。
宿文對大模型的核心做出預(yù)測|圖片來源:極客公園
二、互聯(lián)網(wǎng)或者移動互聯(lián)網(wǎng),給大家留下的思維慣性太強(qiáng)了,不管投資人、創(chuàng)業(yè)者、產(chǎn)業(yè)分析師,在大模型出現(xiàn)的第一天,很快就出現(xiàn)了一個(gè)分析框架,這個(gè)框架鏈條里有基模、OS、Agent、應(yīng)用……但這些分類的基礎(chǔ),都是從上個(gè)時(shí)代復(fù)刻下來的,大模型時(shí)代的鏈條會長什么樣,我們都不知道,它大概率不會長成上個(gè)時(shí)代的樣子。
我們做的過程中發(fā)現(xiàn),做Infra這一層、做基模、做應(yīng)用,各個(gè)環(huán)節(jié)的基礎(chǔ)鏈條都不成熟,在不成熟的時(shí)候,大家如果去等待鏈條成熟,或者自己找一段去完善,這個(gè)商業(yè)通路很難跑通,因?yàn)樗茈y把價(jià)值直接傳遞給用戶。對我們來說,我們有能力把這些鏈條打通到一起做,而不會很刻板地停留在過去的技術(shù)思路里。
三、在大模型出現(xiàn)第一天起,就很多人提超級應(yīng)用,這同樣是互聯(lián)網(wǎng)時(shí)代留給我們的想象。移動互聯(lián)網(wǎng)時(shí)代,我們看到這種超級應(yīng)用本身不產(chǎn)生內(nèi)容,更多是做一個(gè)信息的嫁接平臺或者一個(gè)中間平臺,讓我們搜內(nèi)容搜得越來越快,給我們推薦信息越來越準(zhǔn),讓我們交易越來越高效,但這個(gè)平臺本身不會提供內(nèi)容服務(wù)。
但是到了大模型時(shí)代,這些互聯(lián)網(wǎng)產(chǎn)品特性基本都消失了,大模型只有一個(gè)核心功能:在底層幫大家生成內(nèi)容。
這個(gè)競爭力一定是最底層的,未來超級應(yīng)用長什么樣不知道,甚至不會存在。但是超級應(yīng)用底層是對超級智能的支持,這一點(diǎn)是一定避不開的,這是最內(nèi)核的競爭力。
看起來我們是在做AICoding,但其實(shí)我們是在這樣一個(gè)商業(yè)場景里,去解決AGI自身的問題,我們朝著AGI一路狂奔,也是希望有更多小伙伴像我們一樣,大家向上卷,向核心技術(shù)卷,最后把這些技術(shù)沉淀在產(chǎn)品上,提供給我們的用戶。
本文來源:極客公園
文章轉(zhuǎn)載于其他網(wǎng)絡(luò),如有侵權(quán)請聯(lián)系我們及時(shí)刪除!