企(qi)业智能体(ti)公司元(yuan)理智能(Yoolee AI)近日完(wan)成800万美元(yuan)种(zhong)子轮融资,由蓝(lan)驰(chi)创投领投,光源创业者基(ji)金跟投。
元(yuan)理智(zhi)能(neng)(neng)由(you)智(zhi)谱AI前COO张帆创立,聚(ju)焦(jiao)以商业强(qiang)化(hua)学(xue)习(RL for Busniess)为核心路径建立可靠(kao)自我进化(hua)的智(zhi)能(neng)(neng)体员(yuan)工,公(gong)司(si)希望通过商业场景强(qiang)化(hua)学(xue)习,将基础(chu)模型(xing)能(neng)(neng)力转化(hua)为可量化(hua)的业务成果,推动AI Agent真正落地。
元理智(zhi)(zhi)能创(chuang)始人张帆是AI领(ling)域的连续创(chuang)业(ye)者,早年(nian)在(zai)(zai)法国学习人工智(zhi)(zhi)能,也曾在(zai)(zai)国家科研中心从事机器翻(fan)译研究。2010年(nian)回国后,他曾在(zai)(zai)搜狗、腾讯(xun)负责智(zhi)(zhi)能语音产品(pin)(类(lei)Siri产品(pin))研发(fa),后创(chuang)办(ban)妙计旅行,担(dan)任大搜车CTO;2022年(nian)创(chuang)立元因智(zhi)(zhi)能(后被(bei)智(zhi)(zhi)谱AI并(bing)购),2023年(nian)加入智(zhi)(zhi)谱AI任COO,今年(nian)6月离(li)职再次创(chuang)业(ye)。
张帆表示,目前主流(liu)Agent to B模(mo)式多依赖“定制化(hua)+SFT(监督(du)微调)”的(de)(de)固定工作流(liu),部署成(cheng)本高、场景适(shi)配慢,并(bing)且与(yu)模(mo)型(xing)强耦合,任何模(mo)型(xing)升级都会(hui)带(dai)来巨大的(de)(de)升级成(cheng)本,没办法规模(mo)化(hua)。所(suo)以元(yuan)理(li)智能认为(wei)(wei)强化(hua)学习出现(xian),带(dai)来新的(de)(de)学习范(fan)式,以业务结果为(wei)(wei)导向商(shang)业强化(hua)学习,来构建(jian)企业自进(jin)化(hua)的(de)(de)生产力智能体,使其在真实商(shang)业环(huan)境中(zhong)持续创造(zao)商(shang)业价值。
强化学习在(zai)代码生成、数(shu)学推(tui)理(li)等(deng)“反馈清晰”场景(jing)已取得突破,但在(zai)企业(ye)业(ye)务(wu)中面临(lin)更高维度的复杂环境(jing)。元(yuan)理(li)智能的核心目标在(zai)于,通过(guo)结合业(ye)务(wu)先验与(yu)隐性知(zhi)识,构建真(zhen)实(shi)的奖励(li)函数(shu)与(yu)优化机(ji)制,让(rang)AI能在(zai)复杂商业(ye)决策中持续进化。
行(xing)业目前(qian)有趋势性认知,强(qiang)(qiang)化学习(xi)驱(qu)动的(de)AI Agent正成为全(quan)球AI产业的(de)新(xin)方向。OpenAI前(qian)CTO Mira Murati创立的(de)Thinking Machines Lab也曾提出,用强(qiang)(qiang)化学习(xi)帮助企业基于(yu)营收、利润等(deng)KPI定制AI模型。
据悉元理智能已(yi)经和多(duo)家赛道头(tou)部企业(ye)展开合作(zuo),共同探(tan)索商(shang)业(ye)强化学(xue)习在不同领域的应用和落(luo)地。