【資料圖】
7月7日,京東探索研究院院長(zhǎng)、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬在2023世界人工智能大會(huì)上接受包括經(jīng)濟(jì)觀察網(wǎng)在內(nèi)的媒體采訪時(shí)表示,京東在大模型上一直進(jìn)行技術(shù)積累與布局,并深度結(jié)合了京東和產(chǎn)業(yè)的需求,已經(jīng)陸續(xù)發(fā)布了十億級(jí)、百億級(jí)參數(shù)的大模型。今年的京東探索者科技大會(huì)上,京東即將發(fā)布千億級(jí)參數(shù)大模型。
今年以來(lái),大模型產(chǎn)品批量涌現(xiàn),根據(jù)世界人工智能大會(huì)官方微信披露數(shù)據(jù),2023年的大會(huì)上聚齊了三十多個(gè)大模型及相關(guān)產(chǎn)品。何曉冬認(rèn)為,有市場(chǎng)競(jìng)爭(zhēng)是好事,從2016年以來(lái)就感受到競(jìng)爭(zhēng)非常激烈,這也說(shuō)明市場(chǎng)有需求,其次,競(jìng)爭(zhēng)中產(chǎn)生的技術(shù)和產(chǎn)品才是真正有生命力的。
何曉冬表示,當(dāng)你的技術(shù)過(guò)了一個(gè)門(mén)檻以后,就會(huì)出現(xiàn)百花齊放的情景,各種各樣的衍生形態(tài)都會(huì)出來(lái),包括AI生成的繪畫(huà)、數(shù)字人、人機(jī)對(duì)話等應(yīng)用的出現(xiàn),其實(shí)是因?yàn)榛A(chǔ)的深度學(xué)習(xí)為代表的技術(shù)過(guò)了一個(gè)門(mén)檻。
何曉冬稱京東大模型并不是馬上就產(chǎn)生的,而是多年的鋪墊。他提及2020年時(shí)京東就關(guān)注到了深度學(xué)習(xí)模型和語(yǔ)言生成,當(dāng)時(shí)也開(kāi)啟了語(yǔ)言模型研發(fā)。當(dāng)AI通用算法生成語(yǔ)言時(shí)免不了會(huì)生成事實(shí)錯(cuò)誤內(nèi)容,這樣的情況在to C端或許可以調(diào)侃,但在電商領(lǐng)域是無(wú)法容忍的。“技術(shù)只有和現(xiàn)實(shí)世界的真實(shí)場(chǎng)景和產(chǎn)品產(chǎn)生緊密融合,才有可能真正產(chǎn)生AI落地的價(jià)值。”何曉冬說(shuō)。
2021年京東針對(duì)零售電商場(chǎng)景中內(nèi)容生成專業(yè)度不足問(wèn)題,提出了十億級(jí)K-PLUG算法模型,目前模型已經(jīng)在京東的發(fā)現(xiàn)好貨等場(chǎng)景廣泛應(yīng)用;2022年針對(duì)模型泛化性不足,京東提出了百億級(jí)模型Vega;百億級(jí)模型之后,今年京東再推出千億級(jí)大模型。
何曉冬認(rèn)為,大模型有它的好處,可以容納多種技能,互相之間沒(méi)有太多沖突,多個(gè)行業(yè)都可以覆蓋。帶來(lái)的困難是它的推理過(guò)程和部署成本會(huì)更高,因此對(duì)于一些特定場(chǎng)景,模型不一定求大。
何曉冬在本屆人工智能大會(huì)的公開(kāi)演講中提及,京東言犀大模型在語(yǔ)言方向已經(jīng)有大量的使用,寫(xiě)了超過(guò)30億字的營(yíng)銷文案,使得營(yíng)銷文案生成做到了自動(dòng)化和智能化。他表示,其它已有的應(yīng)用領(lǐng)域還包括數(shù)字人直播、智能政務(wù)熱線、銀行數(shù)字員工等。
何曉冬認(rèn)為,大模型的可靠性問(wèn)題不解決,就無(wú)法在產(chǎn)業(yè)場(chǎng)景中廣泛應(yīng)用。他提到,為保證大模型的可靠性,三年以來(lái)京東在這方面進(jìn)行了一系列改進(jìn),會(huì)把特定的行業(yè)知識(shí)注入文本訓(xùn)練中,比如要寫(xiě)新品文案推薦會(huì)讓它參考產(chǎn)品說(shuō)明書(shū);另外,還會(huì)設(shè)計(jì)一個(gè)損失函數(shù),出現(xiàn)錯(cuò)誤或者重要的內(nèi)容沒(méi)被抓取到,就會(huì)有額外損失,有一個(gè)懲罰模型,最終讓模型學(xué)會(huì)從可信的信源里獲取基礎(chǔ)知識(shí)。
目前大模型朝著通用大模型和垂直行業(yè)模型兩個(gè)方向發(fā)展。何曉冬稱,垂直行業(yè)模型訓(xùn)練成本和訓(xùn)練難度其實(shí)更高,但部署和應(yīng)用成本會(huì)盡量降下來(lái),因?yàn)橹苯雨P(guān)系到客戶的成本。要做好行業(yè)模型,行業(yè)領(lǐng)域的Know-How非常重要,也需要足夠的基礎(chǔ)常識(shí)作背景,才能帶來(lái)好的體驗(yàn)。
關(guān)鍵詞: