大模型开源生态加速形成,金融大模型走在路径选择“分叉口”
21世纪经济报道记者李览青 上海报道在软件开发领域,每当一项新技术横空出世,“开源”和“闭源”,是摆在大厂面前的两条技术路径。
大模型时代亦是如此。开源降低了数据处理与技术开发的门槛降低,但更高投入、更为封闭的闭源模型往往能带来更好、更专业的开发效果。
在今年大模型浪潮中,据21世纪经济报道记者了解,在金融机构探索大模型技术的过程中,都尝试基于已有的大模型开源框架再进行指令微调,以快速实现任务部署,但在生成式AI监管与数据安全保护趋严的背景下,也遇到多方问题。而自主研发的大模型需要的巨额投入往往令人望而却步。
在国内正式对外发布的金融大模型中,除了度小满“轩辕”金融大模型,其他金融大模型全部是闭源大模型。而在通用大模型领域,大厂、创业机构、学界的开源大模型生态在加速形成。
对于金融大模型而言,开源与闭源技术路径如何选择?
“Llama2时代”落幕?
“Llama2作为一个开源模型的时代已经过去了。”9月,百川智能宣布开源升级微调后的Baichuan2大模型,其创始人王小川表示。
Llama2的开源可商用掀起了今年年中大模型应用开发的浪潮。
今年7月,几乎在同一日,有两则来自大厂的消息加速了大模型及应用商业化落地:一个是微软宣布Microsoft 365 Copilot定价,这一“GPT版”Office的全面商用将微软股价推升至历史新高;另一个则是Meta宣布免费将旗下大模型Llama2提供给微软Azure云计算平台上的软件开发者。
“虽然二级市场可能对微软定价公布很激动,但对于大多数开发者对Llama2的开源可商用更兴奋。”彼时,一位投资分析人士向记者表示,这意味着大模型应用进入“免费时代”。
但由于Llama2的中文训练语料不足,其在中文问题上表现仍有缺陷,更重要的是,Llama2的商用协议声明“仅适用于英文为主的环境”,这意味着基于Llama2的中文商用大模型拿不到开源协议。
如今国内大模型开源生态正在加速形成,从代码大模型开源、通用大模型开源到垂直行业大模型开源,覆盖大模型全产业链。
通用大模型方面,除了Baichuan2,阿里云通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat已正式宣布开源,上海人工智能实验室联合商汤科技、复旦大学、香港中文大学推出的“书生·浦语”(InternLM)大模型也已实现开源。
代码大模型领域,蚂蚁集团在外滩大会上宣布开源代码大模型CodeFuse。
在金融领域,今年5月,度小满宣布开源国内首个千亿参数的金融大模型“轩辕”,9月22日,度小满宣布将升级后的“轩辕70B”金融大模型开源,同步在社区开源50G高质量金融语料。据度小满CTO许东亮公开表示,在增量预训练和指令微调阶段,金融数据有所增加,在预训练阶段,模型上下文长度扩充到8k,能够处理更长的金融报告、研究和分析。
技术普惠与开发共创
源代码开放与信息共享,推动了移动互联网的“安卓时刻”。
谷歌是开源生态的一大受益者,正是安卓系统的开源使得众多开发者涌入谷歌体系进行应用开发,帮助安卓系统打败除苹果以外的众多手机厂商,拿下市场大半江山。
而开源生态的加速形成也被视为大模型时代“安卓时刻”的来临,对于机构探索金融大模型而言,开源模型的价值在于降本增效。
“可以说通用开源大模型是技术底座,可以用的我们都尝试过了,哪个好用就用哪个,选好大模型基座以后加上金融语料做预训练,然后在场景实现落地。”有金融机构科技部门负责人表示,其落地场景下的大模型应用主要是基于开源大模型。
据记者了解,在生成式人工智能监管趋严之前,上半年金融机构主要尝试接入的金融大模型是彭博的BloombergGPT与开源的金融大模型FinGPT,同时也探索了通用大模型在金融垂直领域的微调与预训练。
浙商证券金融工程分析团队在一份研报中指出,与闭源的BloombergGPT相比,FinGPT有训练成本低、数据与模型平民化、端到端系统架构等三个优势。
一方面,金融行业是高度动态的,信息和数据以较高频率更新。BloombergGPT 的定期训练成本非常昂贵,因此轻量级适应在金融领域非常有利。FinGPT 可以快速微调以与新数据保持一致,而不是随着金融环境的每一次重大变化从头开始重新训练模型,估算每次训练不到300 美元。
其次,BloombergGPT需要特权数据访问与API接口,而通过FinGPT可以优先考虑模型的轻量和适应性,仅需基于开源大模型输入金融数据进行微调。
最后从系统架构来看,FinGPT的“数据源层、数据工程层、大语言模型层、应用层”系统框架实现了从信息端到投资端的全流程应用。
但在基于开源大模型训练过程中,除了算力,最为突出的问题是高质量数据。“当数据量到达一个程度,大模型确实能够实现能力的涌现,但首先要有这些优质数据。”一位基金信息科技部负责人坦言,在开发侧,要让代码生成可用,需要超过30个优质金融项目代码,但很多机构很难做到。
在这一背景下,对于大厂而言,通过开源可以通过开发者实现技术的共创与变革。在宣布代码大模型“Codefuse”开源时,支付宝小程序云负责人李铮表示,只有将整个技术开源,与社区对接,让更多人使用它,才能解决整个软件研发领域各个环节的问题。“整个代码大模型还在初步阶段,写代码是没有问题的,而且整体能力还在不断提升,但真正解决软件工程问题还有很长的路要走,我们抱着开放的心态与大家共同提升。”
监管趋严下的路径探索
在《生成式人工智能服务管理办法》出台后,传统金融机构对境外开源大模型的使用愈发谨慎,逐步转向基于境内开源大模型应用。
有采访对象向记者提到,短期内用Llama2或者BloombergGPT可以部署一些简单的小任务,但再往前走,还是需要训练自己的基础模型,或者采用符合国内监管标准的大模型。
据记者调研,目前金融机构的选择路径包括两个方面,一种是与大模型厂商联合共创,私有化部署基于金融大模型的模块应用;另一种是接入金融大模型产品,实现部分业务的智能化工具应用。
一位大行云计算方面专家提到,据其走访发现,一线开发人员在实际编码工作中的痛点主要有三个方面。首先,对于不熟悉编码模式、规范的新员工而言,在不知道如何实现代码编码时,缺乏优质、可复用的标准代码作为提示。其次,在开发出现问题时,由于行内研发环境与互联网环境不互通,开发人员无法及时查找到标准参考案例与相应解决方案。此外,开发人员还会面临复杂度较高、耗时较长的问题,部分老旧代码由于缺少注释,维护也比较困难。
因此该行在内部启动智能研发建设,将代码推演预测、代码自动生成、代码检索复用等企业及能力用IDE插件形式进行整合,逐步在开发中心内部推广。“GPT-4技术带来了大量编码阶段的交互式辅助编程能力,未来将颠覆编码体验。”他表示,由于行内信息安全要求,该行基于联合创新机制在探索新的大模型能力。
应用接入层面,据公开信息显示,度小满开源的“轩辕”金融大模型已有上百家金融机构申请试用;9月25日,恒生电子宣布已面向20家金融机构开启金融大模型“LightGPT”内测;而蚂蚁集团向B端金融机构痛的AI业务助手“支小助”也已与合作机构开启内测共建。
更多内容请下载21财经APP
专访复旦大学泛海国际金融学院副院长张纯信:在这些金融科技上,中国领先欧美非常远,且会越来越远
每经记者:易启江 每经编辑:段炼
“金融科技的有些方面,我国超前得非常多,比较明显的是移动支付,央行数字货币也出来了,比起一些欧美国家,我们领先是非常远的,且可能会越来越远,(他们和中国的这种差距)可能会越来越大。”
复旦大学泛海国际金融学院副院长、金融科技研究中心主任张纯信10月30日接受《每日经济新闻》记者专访时,表达了上述观点。
图片来源:主办方供图
张纯信教授2003年获得加州大学伯克利分校金融学博士学位。在此之前,他获得了宾夕法尼亚大学沃顿商学院、工程和应用科学学院的金融学学士和电子工程学士学位。曾任上海交通大学上海高级金融学院教授、美国康奈尔大学酒店管理学院金融学助理教授,在金融科技、投资学、公司金融领域颇有建树。
张纯信教授应邀出席10月30日举行的“2020金融科技创新成都峰会”,并接受了《每日经济新闻》记者专访,就金融科技如何在应用场景上发力、如何创新金融监管等热点问题发表了自己独到的见解。
我们技术非常领先但应用场景是弱点
中国的移动支付已经进入美国,甚至东南亚、非洲,数字人民币也推出来了,那么,中国的金融科技水平,目前在世界上到底处于什么样的位置呢?
对此,张纯信表示,金融科技它不是一件事,它是好几件事,包括大数据、智能科技、云计算、支付、区块链等等。有些方面,我国超前得非常多,比较明显的是支付。“当然,现在央行数字货币也出来了,比起一些欧美国家,我想,我们领先是非常的远,且可能会越来越远,(他们和中国的这种差距)可能会越来越大。”
区块链技术,我们也非常领先。截至去年底,全球的区块链专利有82%是在中国产生的。
在技术方面,中国非常前沿,非常领先,但应用场景是我们的弱点!除了支付、数字货币这样的应用场景我们领先,其他很多方面,我们仍然是服务于别人的应用场景。可能美国人、欧洲人、新加坡人在想该用这些科技做些什么,因为大头其实是在应用上。
相较于其他国家不一样的是,我国对于投资人保护非常重视,“这一点我认为是对的!可能美国觉得反正投资自有风险,投资人你赔了就没了,你自己要负责。在这种前提之下,我们要快速地去发展一些应用场景,可能没有人家那么快,因为人家是无任何枷锁的,它可以随便搞,投资人把钱都赔光了也没关系,把人家退休金赔光了也没关系。”
那么,我们在应用场景上应如何发力呢?张纯信认为,我们可以做资产数字化,“我觉得数字资产的合法化、制度化很重要。包括了资产的数字化本身,经过区块链的技术,经过分流的技术,怎么样把一些不动产或者是本来投资人不容易碰到的一些投资产品数字化。”
张纯信表示,资产数字化这一点,我们目前在全球比较落后。但是,这个是很容易弯道超车的。为什么?因为我们的市场很大。
我们可选的投资产品可能比美国欧洲少一些,所以,一旦有多的数字资产出来,它的市场需求是非常大的,就非常有可能会弯道超车。
所以,即便是我们滞后一点的地方,但市场优势仍然存在,技术优势仍然存在。
金融监管最主要是明确什么可以做
金融科技飞速发展,创新层出不穷。技术是中性的,应用得当能给金融发展注入新动能,应用不当也可能引发新风险。那么,要如何进行监管,才能让这些先进科技既能产生更多前沿应用,又让创新可以规避系统性风险呢?
对此,张纯信表示,在监管方面,有哪一些要去加强,相信会有很多。但是,倒不是说所有的都要去做,或者说所有监管措施马上就要呈现,要一步一个脚印,一个阶段一个阶段去做,“最重要的还是明确什么东西是想做的,明确了,企业就可以去做,银行就可以去做,我们做学者的也就可以有方向性地去学习、去做探究。”
张纯信举例说,比如区块链,国家明确了这是一个核心的创新技术,很快中国的区块链技术就全球领先了,可见,国家的指引非常重要。
区块链这块,可能是在金融科技大数据等等方面牵扯到的问题比较少,比较核心的一些部分都已经得到了解决。“几年下来,从模糊到保守,到现在推进,我们是看到了一个明显的趋势,我觉得这种趋势非常重要。”
“其实金融科技这个行业,尤其是在中国,我们就像一万只小船,只要国家给到我们一个清楚的方针,我们统统都很灵敏的,我们很快就可以上轨道,很快就可以跟上这个船流。”张纯信形象地比喻道,“30年前、40年前,可能我们不是一万只小船,我们是所有人都在一艘大船上,所以那时这艘船可能会很慢。现在已经变化,尤其是新兴产业。国家现在也变得非常的灵敏!”
西部金融中心不是弯道超车而要换道超车
对于正在打造国家西部金融中心的成都,张纯信教授也带来了他的思考。
他说,大家都讲弯道超车,但他认为成都应该可以换道超车。
他认为,要思考传统金融这一块,是不是成都重点要的。现在,新金融已经来临,而传统金融不再是未来的趋势。这种现状之下,成都如果把这个机会用好,那就不是弯道超车,而是直接换道。“不用去复制从前上海怎么做的,或者香港当时怎么做的,而是聚焦在一些新的金融科技上面,我觉得这符合我们成都近几年的发展状况。”他表示。
近年来,成都市为全面贯彻党中央国务院、省委省政府关于国家西部金融中心的系列部署,探索出了一条符合自身资源禀赋、区域特色和产业特点的现代金融业创新发展之路。前不久发布的第28期“全球金融中心指数”显示,成都排名全球第43位,创历史最高水平。
建设金融科技和后台服务中心方面,成都获批央行数字货币和金融科技创新监管试点。
成都金融机构数量和门类均位居中西部前列,初步形成了多层次、广覆盖、差异化的金融机构体系。截至目前,全市共有各类金融机构及中介服务机构2650余家。
成都打造了全球规模最大的金融科技高品质科创空间—“交子金融梦工场”。
沪深交易所、新三板西部基地在成都落户。共有30多家大型金融后台服务中心,170余家金融外包服务机构在成都落地。
而中西部第一个基金小镇——天府国际基金小镇,已入驻包括IDG资本、中信资本等在内的国内外知名基金机构超过400家,累计注册管理规模超过4000亿元。
成都着力构建现代金融产业生态圈,高标准规划建设的交子公园金融商务区,目前已入驻金融服务企业2700余家,金融配套服务机构2200余家。与复旦大学、电子科大、西南财大、国家金融与发展实验室等知名高校智库加强合作,搭建“政产学研用融”平台,推动设立成都金融业联合会暨成都现代金融产业生态圈联盟。
张纯信教授也非常赞同“聚集”效应。“单枪匹马的时代我认为是过去了,新的科技、新兴产业当中,可能需要的是大家的一些协同效应”。而协同效应,需要有足够的精英们聚集。
他认为,“聚集”是非常重要的。怎样把“聚集”的协同价值做起来?要有效地把金融机构,把区块链技术和设计、产品和应用场景、云计算等等的平台载体聚集起来,才能产生协同效应。
相关问答
金融 和 电子 信息 工程 哪个好?你是男生还是女生呢,如果是女生我个人觉得电子信息工程不适合女生,我就是这个专业毕业的,毕业后我们班很多女生都不从事这个专业,如果你是男生,电子信息工程...
什么是 电子金融 ? - aigmLRQz1NZ 的回答 - 懂得电子金融随着电子商务的发展,它的发展速度也是很快的!优点:1、方便快捷。2、安全性。已经无需像以前那样,携带很多的资金在身上很不安全啦。3、网络...
什么是 电子金融 ? - sNM8v96Uh 的回答 - 懂得所谓网络金融,又称电子金融(e-finance),从狭义上讲是指在国际互联网(Internet)上开展的金融业务,包括网络银行、网络证券、网络保险等金融服务及相...
跨专业考研: 电子 信息 工程 转 金融 !该怎么办?电子信息工程考研考金融专业,成功的例子太多了(我的学生(电气专业)考上的管理专业的不计其数),因为英语、高数是统考的得分大头,工科好的是占便宜的。重...
广东金融学院 法学院怎么样?设有哪些专业? 申请方[回答]~接下来我为大家简单介绍一下我们广东金融学院的法学院开设的专业以及研究情况专业设置:法学、电子商务及法律广东金融学院创办于1950年,是华南地区...
电子金融 的好处都有什么..._电子商务_帮考网1.方便快捷:电子金融可以通过互联网、手机等渠道进行交易,无需到银行柜台,节省了时间和精力。2.低成本:相比传统银行业务,电子金融的运营成本更低...
西安 电子 科技大学 金融 专硕几年?西安电子科技大学金融专硕学制3年西安电子科技大学的金融专硕是经济与管理学院下开设的专业,不分方向招生。西安电子科技大学经济与管理学院的前身是1980年...
电子 商务属于 金融 类专业吗?电子商务专业是金融学与电子商务交叉融合学科,属于应用经济学一级学科下的硕士点,本专业以电子商务“三流”中的资金流与信息流为研究领域,以网络银行和网络金...
什么是 金融电子化 ?- 汇财吧专业问答[回答]相关范文:电子商务在线支付中可能出现的问题及其解决方案[摘要]虽然我国电子商务网上支付有巨大的发展空间,但由于其发展历史短,所以存在着不少问题...
从事 电子 商务的公司属于 金融 机构吗?不属于,电子商务是指通过互联网进行产品销售,但不包括金融产品,金融产品的互联网营销有专门的管理体系,因此不可一概而论不属于,电子商务是指通过互联网进行...