我们有3亿道题,至少60家大模型要买|专访景联文

[探索] 时间:2024-04-25 23:51:27 来源:蓝影头条 作者:探索 点击:58次

    在人工智能日益崭露头角的亿道时代,数据标注成为了支持AI系统学习和成长的题至关键环节。而在这一背后不太为大众所知的大模领域,景联文科技显然已经占据了一席之地。型买,专访这家企业不仅为全球的AI从业者和研究机构提供多元化的数据服务,还在医疗、景联教育等领域深度耕耘,亿道打造出了专业题库和医学资料数据库。题至为了了解更多关于景联文科技的大模故事,娱乐资本论·视智未来采访了其CEO刘云涛。型买,专访景联文科技成立于2012年,是景联一家以人工智能数据服务和软件开发为主的科技企业。,亿道, ---以下为采访实录--- ,视智未来:可以介绍一下你们公司吗?,景联文科技CEO刘云涛(下同):,2012年,我们看好人工智能赛道,题至成立了景联文科技,大模是一家以人工智能数据服务与软件开发为主的国家高新科技企业,为全球的人工智能从业公司和高校科研机构提供AI数据采集、数据标注、数据集产品、标注平台定制开发等服务。,视智未来:你们数据采集标注的主要业务范围是?,业务范围包括常规的算法模型训练需要用到的图像视频、语音、文本、点云等。此外,我们也投入了巨额成本在指纹数据采集和泛健康领域的心率、血氧、血压等数据采集业务上,目前全球几乎所有手机厂商、指纹芯片厂商、测试机构的指纹数据都来自景联文科技。,,视智未来:你们在降本增效上有新举措吗?,内部降本上,我们通过自研智能标注平台和内部标准化管理系统的加持,提高内部的协同流程,将非标准化产品做标准化操作,降本增效。现在,2D拉框标注项目的成本降低了50%。,同时我们也一直深耕在数据领域的专业度,比如我们在AI医疗健康领域重点加大研发投入和设备投入,目前我们在该领域可以说是行业专家。,视智未来:你们有客户分类吗?,数据采集标注是非标准化产品,小客户和大客户相比,订单量和收益都相差很打,经过一系列的沉淀思考和利润考核,我们更愿意选择在头部客户中做深耕。,视智未来:你们现在的数据标注员工的情况是?,现有景联文科技在全国有超过1000名全职标注人员,标注基地分布在杭州、衡阳、金华、武汉等。,随着AI行业快速发展,数据标注行业对标注员的学历等级、语言能力、理解能力,专业知识背景的要求都越来越高,比如语言标注团队要求会各种小语种,医疗标注需要医学院毕业的学生。,视智未来:工资的下限和上限能到多少?,只论标注人员,AI越来越智能,简单的标注项目越来越少,标注难度越来越高,每个采集标注项目的难度也不一样,工资上下限空间差距很大,上限能到11000,下限的话3000左右。,视智未来:人力成本占公司经营的多少呢?,40%人力成本,40%左右研发成本,剩下来20%综合成本。景联文科技已经从以前的纯人工标注,发展为目前AI算法预标注加人工标注审核的生产模式。不能把数据标注公司做成一个人力公司,但也不是像网上讲那么疯狂,说标注可以完全自注化,一万框一秒钟就能拉完。,视智未来:你们的壁垒是什么?,第一、目前大语言模型火爆,把我们点爆了。教育方面,我们手上有3亿道从小学、大学到职业教育的题,格式统一,解析维度包括专题分类、分析过程、考点解析、解答过程、教师点评等。医疗方面,我们也有超过400TB的医学资料数据库。现在大模型号称百模大战,至少有60家都要买我们的题库。         ,,第二是客户资源。市面上80%以上的科技企业、独角兽、上市公司,我们都在他们的供应商库里,这就跟其他新公司不一样。景联文有非常好的市场资源和客户资源。,第三是产品,在标注领域我们不断投资研发景联文智能标注平台。,第四是内部管理系统,景联文从一个项目客户进来,到最后项目结束是一整套的内部标准化的管理系统,能够实现降本增效。,第五是专业性,原来我们和同行公司对 AI医疗和健康领域的数据采集都不专业,三年前出现心率、血氧、血压这些数据业务,同行不关注,景联文科技关注,重点投研发、买设备,招投标时虽然同行都参与,但他们的价格永远比不过我们,因为这项业务他们做不了就要委托别人去做,成本就高,但我们是很低的,这就是核心竞争力。,视智未来:数据标注未来有哪些新机会和挑战?,数据要专业性和前瞻性,比如医疗大模型需要三甲医院的专家的病理数据,才能去做更高级的判断,否则这事儿就没有意义。前瞻性是要比其他人看的更远更长更快,比如我们两年前就开始拓展标注场景,选了医疗赛道,我相信不管经济多不景气,医疗始终有存在的意义和价值。,视智未来:政策方向你们有什么建议吗?,未来,中国的数据流通怎么更合规化、更安全化是很大的问题,现在很多城市也在建立大数据交易中心,是积极的信号。

(责任编辑:娱乐)

    相关内容
    精彩推荐
    热门点击
    友情链接