他用AI算法,解码现实世界的“眼睛”与“耳朵”丨桂在智造 极客出发


让法院卷宗处理效率与准确率双双提升50%以上,为司机提供7x24小时车辆在途风控服务……90后苏家仪是北投信创集团人工智能团队的技术骨干,他带领团队构建了AI能力底座,让机器听懂人类语言,获得“眼睛”和“耳朵”,用科技赋予传统行业更多价值。

从“实验室萌芽”到“产业落地”

今年32岁的苏家仪,毕业于中南民族大学电子信息工程专业。他首次接触人工智能领域,源于大二下学期在学院实验室做的一个课题。

“当时导师给我布置了一个关于人工智能的课题,要求用算法把语音信号转化为文字。”苏家仪回忆道,那是实验室首个人工智能课题,他带着师弟一起花了大量时间进行系统学习和实验。“当算法第一次准确转写出‘你好’时,我非常兴奋,人类的听说读写能力,都可以通过计算机完成。”

这份对“赋予机器感知能力”的执念,贯穿了苏家仪此后的十年。毕业后,他在科大讯飞研究院研发离线语音识别技术,让输入法在无网络环境下仍能“听见”用户指令。回南宁后,他参与了车牌识别、人脸识别、农作物病虫害识别等视觉算法的开发。2022年加入北投信创集团后,他更将“听觉”“视觉”能力整合升级,构建出支撑多领域应用的AI能力底座。

图片2.png

苏家仪(左三)与北投信创集团人工智能团队。本文图片均由受访者供图

让AI长出“通用感官”

“真正的人工智能不应被单一感官束缚。”在苏家仪主导研发的AI能力底座中,这一理念化为现实:通过多模态算法集成,自然语言处理、计算机视觉、语音识别等技术被整合为标准化接口。此外,底座还整合了全场景算力资源,确保不同行业、不同场景的AI应用都能按需获取适配的计算资源。

图片1.png

苏家仪在一次志愿服务活动中带孩子们体验大语言模型问答。

司法领域的突破最能体现这种技术张力。面对法院堆积如山的卷宗材料,传统人工编目日均处理量约3000页。怎么用AI提高效率?“当事人提交的材料可能是手机截图、手写材料甚至模糊照片,就像把一堆杂乱拼图丢给AI。”苏家仪说,当时他们团队共4人,用了一个月的时间研发出“法院智能编目算法”,通过引入多模态大模型,先对材料进行大类分拣,再针对性地提取关键信息。AI作为智能助手先自动编目,工作人员后续只需校对。如今,全区32家法院通过该算法的规模化应用,人工日校准量从3000页提升至7000页,大幅提升编目效率。

交通运输安全场景的应用,则验证着另一重技术韧性。“目前广西有600多家运输企业在使用我们研发的道路运输车辆风险管理平台。”苏家仪介绍,该平台通过端云协同的方式,车载终端实时分析驾驶员状态,云端同步进行深度风险研判。例如,有一次后台算法检测到一位司机长时间疲劳驾驶,风险等级过高,AI自动生成风险工单,由人工客服校对后向车载终端发送语音播报,建议司机尽快停车休息。“但在实际应用时,总有一些情况是模型之前没学过的。我们就建立了数据闭环机制,不断优化模型和算法。同时,利用多模态大模型的开集识别能力适应更多复杂路况。”

未来瞄准具身智能技术

在AI算法研发领域深耕近十年,苏家仪已累计获得十余项国家发明专利。“我平时工作中会整理两个清单,一是问题清单,专门记录各种问题;二是技术清单,每天都会关注人工智能行业的科技动态。”苏家仪认为,人工智能是门实践学科,灵感必须长在真实需求的土壤里。

图片3.png

苏家仪在一次讲座中进行分享。

谈及未来计划,苏家仪说,团队将拓展更多AI场景,如公文写作、档案审查等。前不久,北投信创集团还与马来西亚MYEG集团签署了合作协议,双方将共同建设并运营中国—马来西亚人工智能创新合作中心,研发适合当地应用的人工智能产品,推动跨境场景实践。

“团队正布局当前前沿的智能体和具身智能机器人技术,将进一步提升现有系统的智能化水平,同时将智能延伸至实体机器人,解决更多现实问题。”苏家仪透露。