今年AI产业融资超800亿,新一轮AI技术创新周期有望开启

成都商报TMT发布 2023-04-24 17:29

成都商报TMT发布

成都商报TMT发布平台

>

随着中国数字经济的深入发展,产业数字化进程不断加速,大数据在产业决策中的比重越来越高。今时今日,人工智能不再是科幻电影中无法触及的概念,它已成为家喻户晓的“现实”,在减轻人类的体力负担和脑力负担方面已渐渐显示出优势,在极端天气预测等多个生活层面显露头角。

以Chat-GPT爆发为新起点,AI深度学习、大模型等关键技术的深入发展,将推动人工智能快速迈入下一个“未知”的阶段。近日,天眼查数据研究院特此推出“天眼新知”专栏,以天眼查大数据为依托,梳理人工智能产业格局及发展脉络,解读人工智能产业领域最新动态和投融资风向。

人工智能2.0时代,工具属性与思维能力深度融合

在大多人的眼中,人工智能是一位非常给力的助手、工具,可以实现处理工作过程的自动化,提升工作效率,比如执行与人类智能有关的智能行为。但与之其工具属性,能力属性相比,人工智能更为重要的是一种思维,是用来描述模仿人类与其他人类思维相关联的“认知”功能的机器,如“学习”和“解决问题”。

人工智能概念于1956年被提出,AI产业的第一轮爆发源自2012年,2012年AlexNet模型问世开启了CNN在图像识别的应用,2015年机器识别图像的准确率首次超过人(错误率低于4%),开启了计算机视觉技术在各行各业的应用,带动了人工智能1.0时代的创新周期,AI+开始赋能各行各业,带动效率提升。但是,人工智能1.0时代面临着模型碎片化,AI泛化能力不足等问题。

2017年,Google Brain团队提出Transformer架构,奠定了大模型领域的主流算法基础,从2018年开始大模型迅速流行,到2022年模型参数达到5400亿,模型参数呈现指数级增长,“预训练+微调”的大模型有效解决了1.0时代AI泛化能力不足的问题。新一代AI技术有望开始全新一轮的技术创新周期。

天眼查数据显示,截至目前,人工智能相关企业近267.4万余家,其中,2023年一季度新增注册企业17万余家,与2022年同期相比,上涨6.8%;从地域分布来看,广东以39.9万余家位列区域首位;江苏、北京分列二、三位,分别拥有22.4万余家以及21.8万余家;从成立时间来看,53.6%的相关企业成立于1-5年内,成立于1年以内的相关企业占比27.7%; 另据天眼查不完全统计,人工智能产业自2023年1月以来,融资事件合计发生143起,融资金额超800亿元。

数据、算法、算力:人工智能的“三驾马车”

“巧妇难为无米之炊”,人工智能的快速发展推动关键要素——“数据”的规模不断提升。据IDC测算,2025年全球数据规模将达到 163ZB,其中80%-90%是非结构化数据。数据服务进入深度定制化的阶段,百度、阿里巴巴、京东等公司根据不同场景和需求推出数据定制的服务,例如阿里巴巴联合香港理工大学基于服装设计知识开发FashionAI知识集,加速了AI在服装设计产业落地应用。

算法方面,根据中国信通院《人工智能白皮书(2022年)》,超大规模预训练模型持续推动技术升级,继续朝着大规模、多模态方向发展。自2020年OpenAI推出GPT-3后,谷歌、华为、智源研究院、中科院、阿里巴巴等企业和研究机构也相继发力,陆续推出超大规模预训练模型,包括Switch Transformer、DALL·EMT-NLG、盘古、悟道2.0、紫东太初和M6等。

轻量化深度学习技术正在显著提升计算效率。例如,紧凑模型的典型代表有谷歌提出的MobileNet和旷视提出ShufleNet等,百度推出的轻量化PaddleOCR模型规模减小至2.8Mb,在GitHub上开源后受到热捧“生成式人工智能”技术不断成熟,未来听、说、读、写等能力将有机结合,例如央视、新华社、光明网等均推出了数字人主播。

与此同时,新的算力架构也在不断探索中,类脑芯片、存内计算、量子计算等备受关注。面向手机应用的智能芯片成为亮点,2021年1月,联发科推出了高端手机芯片 Dimensity 1200,可边缘处理5G、AI和图像数据等;8月,谷歌为其Pixel系列手机专门推出了首款智能手机芯片Tensor。

据天眼查知识产权不完全统计,人工智能相关的专利申请自2023年1月以来,已有1610余项,其中,发明专利占比超过7成。与GPU相关的融资事件合计发生98起,融资金额超280亿元;其中,2023年融资事件合计发生3起,融资金额超4亿元。

数据标注:人工智能背后“人工”的力量

人工智能,其实是部分替代人的认知功能。人工智能算法是数据驱动型算法,也就是说,如果想实现人工智能,首先需要把人类理解和判断事物的能力教给计算机,让计算机学习到这种识别能力。

类比机器学习,我们要教它认识一只猫,直接给它一张猫的图片,它是完全不知道这是什么。我们得先有猫的图片,上面标注着“猫”这个字,然后机器通过学习了大量的图片中的特征,这时候再给机器任意一张猫的图片,它就能识别出来这是猫了。

因此,目前人工智能需要标注大量数据,即对原始信息进行数据标注。数据标注是大部分人工智能算法得以有效运行的关键环节。数据标注是把需要机器识别和分辨的数据贴上标签,然后让计算机不断地学习这些数据的特征,最终实现计算机能够自主识别。这类工作量极大、过程极其枯燥且耗时的手动数据标记过程,已经成为AI经济体系中的重要组成部分。

据天眼查知识产权不完全统计,与数据标注有关的专利申请,自2023年1月以来,已有34项,均属于发明专利。

应用领域:从知识学习、到交通出行

3月14日,Open AI正式发布多模态大模型GPT-4。创始人 Sam Altman 表示,GPT-4是迄今为止功能最强大、最一致的大型多模态模型,能够接受图像和文本输入,在各种专业和学术基准上均表现出了人类水平。人工智能的发展已经进入了认知智能领域,文本智能、图像智能、音频智能、视频智能以及多模态认知智能,将会逐步诞生,未来为了应对复杂和多变的应用场景,多模态智能的发展方向将成为必然。

此外,人工智能在自动驾驶及生命科学领域也有着不俗的战绩。在自动驾驶中,人工智能主要负责实现自主决策和智能感知,这些感知因素包括道路情况、交通情况、天气情况、行人和其他车辆的行动,以及其他各种因素;2022年,DeepMind公司与欧洲生物信息研究所的合作团队利用人工智能(AI)系统AlphaFold预测出超过100万个物种的2.14亿个蛋白质结构,几乎涵盖了地球上所有已知蛋白质。这一突破将加速新药开发,并为基础科学带来全新革命。

就前景而言,天眼查研究院认为,未来人工智能是否会真正替代人的讨论仍将持续。人工智能是引领未来的新兴战略性技术,是驱动新一轮科技革命和产业变革的重要力量,国家数据局的成立也有望加速数据要素市场化。应用领域层面,AIGC领域目前呈现出的内容类型不断丰富、内容质量不断提升、技术的通用性和工业化水平越来越强等趋势。

人工智能,是一场关于知识学习的革命,机器学习、深度学习、大模型等让人望而却步的概念不过是机器理解世界的范式。与其杞人忧天,担心被机器所替代,不如与“机器”同行,让工具“为我所用”。


红星新闻记者 郭晶晶