国际生物多样性日 | AI如何帮助我们认识生物多样性?
编者按:
联合国大会于2001年5月通过决议,每年5月22日为“国际生物多样性日”,以增加对生物多样性问题的理解和认识。生物多样性关系人类福祉,是人类赖以生存和发展的重要基础,是经济社会可持续发展的物质条件。保护生物多样性具有十分重要而深远的意义。
近期,公众号陆续推出了人工智能系列文章,恰逢国际生物多样性日,那么,AI工具会怎样帮助我们认识生物多样性呢?让我们一起跟随作者的视角了解一下。
让“指鹿为马”无处遁形
故事起源于一则朋友圈。
不久前我在家里阳台上发现了一只鸽子,它显然已经搭好了窝,正在孵蛋。这一举动并没有经过房主的准许,所以我把它的行径公之于众。不久就有好事的同事留言纠正我,说这其实是一只斑鸠。尽管“学生态的应该认识身边的物种”是一个刻板印象,但我感到略失颜面,并决定亲自鉴定一下。
我使用BirdNET,一款康奈尔大学(可以理解为美国农大)开发的基于深度学习的AI鸟类声纹识别软件帮助我完成这一任务。用户界面非常简单,我上传了一段阳台上的叫声后,它很快告诉我这是珠颈斑鸠,almost certain。不甘心的我又去查阅了珠颈斑鸠的形态学特征,并不得不承认这大概率真的是一只珠颈斑鸠。

BirdNET AI鸟类声纹识别
在这个过程中人类和AI对物种的认知方式是不太一样的。人类通过观察和实验总结了物种的形态学、生理学和行为学特征,通过文字描述这些特征的组合来定义一个物种。鉴定斑鸠的过程尚且友善,对比之下,植物分类学则有着陡峭的学习曲线,不下点功夫,恐怕很难理解“离基三出脉”“复伞形花序”是什么意思。AI不需要理解这些术语的含义,它通过监督学习的方式从训练集中提取它可以理解的关键特征。随着样本的增加,AI的预测与训练集之间的差距不断缩小。训练完成后,AI会提取新样本的特征,并做出预测。拿BirdNET来说,用户每上传一段音频,系统会首先将其切分为以1s为间隔的片段,对每一秒的音频生成预测结果,再由统计学方法整理全部预测,最后给用户反馈为一个物种和与之相应的置信度。
我们如何评估AI声纹识别的准确程度呢?目前,主要通过准确率和重现率两个指标实现。准确率衡量了预测结果的正确与否,重现率反映的是AI是否能准确判断鸟类出现的频次。比方说,同桌喊了我三次我才听见有人叫我,这说明我的准确率100%,重现率33%。据评估,BirdNET的准确率可达59%-94%,重现率仅为43%。这里面有噪声、收音设备和距离等客观原因,牺牲重现率也是开发者刻意设计的结果:因为在生物多样性调查中,少发现一个样本总要好过把珠颈斑鸠鉴定成朱鹮。有趣的是,尽管鸟类声纹识别在准确程度上尚有诸多不足,但有研究发现鸟类声纹多样性和生态系统修复进程呈正相关,这使得这类AI工具具有快速评价生态系统健康的潜质。
通过图片或声音识别物种早已不是独门秘方,除了通过声纹识别动物的BirdNET和Arbimon,还有通过图片识别植物的形色和iNaturalist,后者在AI鉴定后,为置信度较低的结果加入了专家组投票的人为排查方式。这几家也都意识到仅仅用AI完成物种鉴定实在浪费数据,因此,纷纷发挥自己的算法特色、数据处理能力和用户体量优势,想方设法地将离散的物种鉴定数据整合为有意义的生物多样性调查数据库。在这方面Arbimon有较为深入的探索。它不仅接纳、分析全球个人用户上传的音频数据,还与WWF等组织合作,为特定项目布设声纹监测设备。这样,全球用户都可以实时看到在秘鲁又发现了几种珍稀两栖动物,几种入侵生物,他们的时空分布如何,封山育林究竟有无成效。

Arbimon系统界面
帮它走进“舒适区”
获得了物种观测数据还远远不够,如果能从这些观测数据里发现物种的分布规律和对生境的需求,后面的保护工作岂不易如反掌?这种基于数据的预测正是AI之所长。拿MaxENT最大熵模型来说,即使物种分布数据信息及分布区的环境变量不完整,也能对物种的潜在时空分布区进行准确的预测。这可以帮助科学家回答气候变化、环境污染如何影响物种分布这类命题。MaxENT是完全开源的,目前,也集成在了ArcGIS Pro这类商业软件中。即使你不懂最大熵原理和各类机器学习算法,也能用专业知识最大限度发挥AI的预测能力,或者对AI模型的问题建言献策。

ArcGIS Pro内嵌的MaxENT示例模型

鸟瞰地球

我们把视角从种群和群落进一步上升到景观生态学角度,AI正式迎来了它的主场。基于机器学习和深度学习的遥感影像分类技术经过几十年的发展已经颇具规模,分类方法琳琅满目,参数选取应接不暇。我尝试从无人机采集的河岸带正射影像中计算各植被类型的覆盖度,首先,运用了K-均值算法进行非监督分类后,结果可以说是与泾渭分明相距甚远,小溪与人行道难分彼此,乔木和草地混为一谈。我试验了多种非监督分类方法,结果依然不尽人意。

遥感影像的非监督分类
非监督分类本质上只是基于图中各波段仅有的信息做出判断,属于聚类统计分析。于是,我又尝试了监督分类,也就是按照我对土地覆盖类型的主观理解,将影像中的一部分作为训练样本,通过SVM机器学习算法提取各类型的特征,再举一反三预测全图。稍候片刻,拿到结果,除了AI坚定地把一个楼顶认作草地,其他地方顺眼多了。红框内草地与乔木边界清晰,这部分即便肉眼分辨怕也需要点耐心。由于,缺少植被调查中十分重要的近红外波段,为了进一步区分同样为深色的乔木和草地,我又在原有的RGB三个波段上加入了灰度波段来弱化颜色对分类的影响,第一次分类中草地上的绿色斑点终于被优化掉了。

遥感影像的监督分类

DHI MCSAV系统界面
谁是老师
生态学不似物理学那样有着放之四海而皆准的定律,瞬息万变的环境因子和盘根错节的生态过程为人类探索生态规律之旅增加了艰难险阻。即便是那些最著名的方程,也大多自谦的称为“principle”“model”“pattern”,而非“law”。生物多样性作为生态过程的宏观表现,更是看不清、摸不着,似有迹象可循,却又无比神秘。AI工具的发展不仅可以帮助我们更轻松地鉴定鸟类,预测种群变化和栖息地的时空分布,也为我们提供了全新的视角。
我又想起了前面那张放飞自我的非监督分类地图,它真的一无是处吗?它表达的是AI对现有信息的自我理解,这种未受已有知识框架影响却善于从现有信息中高效提取特征、做出预测的能力,是AI的魅力之处。诚然,那张图片仅有可见光波段的信息,可怜的数据量和相对简单的算法导致结果令人摸不着头脑。但随着数据采集技术和算法的进步,获得广泛数据资料的AI,也许能发现人类所不能发现的规律,对生物多样性这种精彩而复杂科学的认识提供新思路。
国家发展和改革委员会等相关部门联合发布的《生态保护和修复支撑体系重大工程建设规划》中提出建设全国重要生态系统保护和修复重大工程监测监管系统、加强林草生态网络感知信息化建设,这正是AI技术与生态学协同发展的新天地。从DHI MCSAV平台那样人类训练AI到AI启发人类,或许并不遥远。


郭嵩,1997年出生,首创智能解决方案经理。毕业于哥本哈根大学自然管理系,发表SCI论文三篇。热爱乒乓球、手风琴、皮划艇。现从事海绵城市建设、生态健康评价等相关解决方案工作。