4月28日,崖州湾国家实验室精准设计与智造团队,中国农业大学和上海人工智能实验室共同发布了首个种业大语言模型“丰登” ,英文名称Large Language Model for Seed Design (SeedLLM)。该模型集成了先进的人工智能技术(书生·浦语2.0)与大数据分析,对海量来自不同渠道的育种科研文献、技术书籍及网络资源进行深度解析和索引,在品种选育过程、农艺性状描述、栽培技术推荐和历史推广区域查询等四大应用场景中,为用户提供解释和回答。“丰登”模型在由国内育种专家制定的标准测评中表现远超农学相关专业本科生,综合得分是本科生的4.87倍。
该模型具有4大核心能力:
1.整合分散的知识资源:系统深度挖掘并结构化我国在育种领域迄今积累的包括学术文献、书籍、田间日志在内的广泛知识。
2.跨领域知识融合:利用多学科知识图谱,整合了生物学、遗传学、气象学、土壤学等相关领域的知识,发掘这些领域之间的新联系。
3.提高访问效率:通过自然语言对话接口降低了技术门槛,用户可以直接提出问题并迅速获得易于理解的答案,提高育种工作效率。
4.知识共享与传播:不仅服务于育种专家和科研人员,也向全国的农业工作者提供必要的支持,加速了育种知识的广泛传播和应用。
为全面评估“丰登”的专业性能,实验室精准设计与智造团队、中国农业大学和上海人工智能实验室,组织育种专家设计了100道水稻育种专业问题及对应标准答案,涵盖品种选育过程、农艺性状描述、栽培技术推荐和历史推广区域查询四大任务。共计115人参与本次标准测评,其中包括14名国内水稻育种专家,49名农学相关专业研究生和52名本科生(大三及以上)。评估团队通过排序和打分的方法,对“丰登”的回答在准确性、稳定性和推理能力等方面进行了细致评价。测评中还引入了本科生的回答作为测试基准。该测评结果表明,“丰登”在最佳答案个数和综合分数上的表现均超出预期,且在多个评估维度上超越了语言模型国际领先水平代表Anthropic Claude3和OpenAI GPT-4。这些结果充分证明了“丰登”种业大语言模型在处理水稻育种相关知识方面的潜力。
“丰登”v0.1拥有200亿参数,现已开放水稻相关知识的测试接口申请。首批参与测试的单位除崖州湾国家实验室和中国农业大学外,还包括隆平高科、中国科学院、中国农业科学院、正大集团、复旦大学、华中农业大学、华南农业大学、上海市农业科学院、广东省农业科学院等。我们诚邀国内育种领域各单位参与研发,提供高质量语料,涵盖更多品种,助力中国种业。
有兴趣参加测试和参与研发的单位,请联系我们以获取更多信息及测试申请表格。
联系方式:
崖州湾国家实验室 杨博士
yangfan@yzwlab.cn
上海人工智能实验室 董博士
dongnanqing@pjlab.org.cn
中国农业大学 王博士
wangxq21@cau.edu.cn
附1:对照模型介绍
1.GPT-4: 美国OpenAI公司开发的多模态语言模型,能够生成高质量的文本,并在数据分析、艺术创作等多领域表现出色,被广泛认为是目前全球最先进的语言处理工具。
2.Claude3: OpenAI 最大竞争对手Anthropic开发的人工智能语言模型,通过Constitutional AI技术减少误导性内容,提升了用户交互质量。
免责声明:本网转载自其它媒体的文章,目的在于弘扬科技创新精神,传递更多科技创新信息,宣传国家科技政策,展示国家科技形象,增强国家科技软实力,参与国际科技舆论竞争,提高国际科技话语权,并不代表本网赞同其观点和对其真实性负责,在此我们谨向原作者和原媒体致以崇高敬意。如果您认为本网文章及图片侵犯了您的版权,请与我们联系,我们将第一时间删除。