2023年会分享:让识别蝴蝶更简单:从图鉴到ai算法

自然笔记年会,文浩介绍了近些年他一直在推进的两件事——蝴蝶图鉴,以及AI鉴蝶。他以一己之力完成了一个团队才敢接的工程,令所有观众敬佩不已。

想要详细了解内容,可以通过以下两个通道:

1、B站视频

2、微信公众号

 

让识别蝴蝶更简单

文字记录(AI整理)

今天主要想讲一下这一年。主要是最近这一阵做的一些事情,然后之前工作老师一直想让我说一说做啥,但是一直忙,没有机会说,然后正好今天这个机会给大家介绍一下。

首先就是介绍一下这个背景就是我做这些事情是想干什么,首先介绍一下这个中国的蝴蝶资源,中国蝴蝶的种类,大家可以看有2400多种,它这个多还是少?可以看到其他的一些最多的是哥伦比亚。有3900多种。一般可以看到在这些赤道附近。特别有雨林的这些地方。它多样性蝴蝶多样性都非常丰富。大概是肯定要比中国多的,如果不是在赤道附近,比如说一些其他的一些国家,比如说美国。只有700多种,欧洲也只有400多种,像只要是有这种人口大规模活动的一些地区。它蝴蝶种类数都不是特别高。这样来看,我们中国有2400种非常多了。

首先就是我们中国这个面积非常大,多样性,也就是环境的生态的多样性就是生境的多样性也非常多。所以说导致蝴蝶的多样性非常多。就这个动物类群来说,2400种大概是个什么概念,大家可能对鸟类比较熟悉。就根据鸟类的。中国观鸟年报的他们每年都会出名录。它这个版本我用引用的是10.0,大概好像是2022年的版本。大概中国鸟类记录的鸟类有1500多种。可以看到蝴蝶的种类数要比鸟类还要多。所以说和鸟类一样,这个蝴蝶我认为是一个非常适合进行自然观察的物种。它有很多特点,比如说它是日行性的大部分蝴蝶几乎所有蝴蝶都是白天能看到的。它和人类作息非常是11致的,不需要那种夜观晚上。去登右他喜欢很多蝴蝶是。他非常活活动,活活非常活泼的。他经常能被人看到,因为他是一直在飞行当中。不像有些你要去仔细去找他,你在他,你要沿着山路走的话,就经常能看到这个飞飞舞的蝴蝶飞过来,就是说非常适合就普通人能见到他。

首先它也非常漂亮,它多样性刚才说了非常高。种类数非常多,它这个习性也非常丰富,大家可以看这个是两只蝴蝶在打架,是我们在这个。我一个朋友在武夷山保护区拍到的,这是国家一级保护动物金会。它有长虫,包括幼虫,还有非常丰富的习性。包括它和自然环境之间有非常密切的关系。比如说左边这个雪山,在这个海拔比较高的地方,有非常独特的蝴蝶,它和海拔有很多很大的关系,不同的海拔有不同的蝴蝶。他和技术。就是植物有着非常大的关系,就是说蝴蝶它是一个寡食性的物种。它可能只吃那么一类植物。鹅子只吃像蚕只吃桑叶一样。这么适合观察,但是可以看到这个鸟类,现在观鸟在世界上还有在我国都是非常发达的,但是这个光碟其实没有这么丰富的,这种活动在里面。我想为什么其中有一个原因,我认为就是。

蝴蝶的辨识比较困难,比较典型的就是植物的一些有一些非常疑难的,比如说菊科非常难鉴定。包括鸟类有很多很难鉴定的种。这些包括下面看到这四种还价。看起来都是一样的,就对初学者而言,非难非常难去鉴定。让他们拿一本图鉴。去翻,然后去仔细的去看究竟区别点在哪,它在短时间内也很难掌握这些东西。这就是提高了关联的门槛。你你不能去识别这些种类的话,你关节的乐趣就是少了很多。你能认识很多蝴蝶,你在野外观察的过程中,你就比较得心应手。肯定非常能激励你的积极性。在这方面鸟类包括植物都有。多非常水平非常高的图。我感觉是对这些爱好者的人群的扩大起了很大的作用。

这几年我一直在编写一本蝴蝶的图鉴。所以说给大家汇报一下目前的一些部分工作,首先我一开始就是和那个。跟他们那个朋友帮朋友忙,然后在这个一个网站上建立了框架,就是把这些物种的名录都放上去,然后这样大家可以往上传这个蝴蝶的照片。就可以把它鉴定为不同的种类就能分门别类的管理自己的照片。包括我还整理了一个名录。如果想编写一本图鉴的话,首先你要摸清。究竟中国到底有多少种蝴蝶?是2000。2015年我就没有再做这个事情了。就没有再更新了,因为之后就是出了一本中国的蝴蝶图鉴它有那个比我。更完善的一个名录暂时我就没有更新了,包括忙着这个土建的事就没一直没有继续更新,然后我还在这个,另外就是在这个。

大家可能很多人都在用非常好用的一个国外的一个网站,就是大家能在上传自己的观测记录,然后可以对这个别人的观测和自己的观测进行一个鉴定。我在上面也建立了非常多的图,包括。在平常也很多人找我来煎饼蝴蝶。这样我有很多关系就比较多,就和很多人建立了非常好的一个关系。然后就能一起合作就互通有无?

然后把中国蝴蝶的观测的记录给整合起来。就是我做的一个把中国的所有的。不同的蝴蝶的种类。每一种都是把它文献里和我们爱好者的这些观测记录,这给它综合起来,然后把它一个图片的形式来展现出来。因为蝴蝶没有像鸟类这样的观测记录的网站,就说我暂时还是我在我自己这个。手工就是进行这个数据的添加和数据的整理,大家可以看,除了这个分布还可以统计了这个蝴蝶的。发生的发生期的信息有些蝴蝶它只在一年中的几个月份能见到。还有海拔的分布信息,有了这些信息以后。直观的让大家去了解一下蝴蝶,中国蝴蝶的不同种类一些。具体的一些分生态的习性情况,再找,下面就是讲一下图鉴。

首先就是说蝴蝶的图像可能和鸟类图像不一样,它主要是分为这个两类就是生态图像和标本图片。传统的土建一般都是标本图建,就像这样的土建。采集了标本以后,把这些标本的图作为一个展示。土建有一个不太好的地方。你像这些比较大的蝴蝶,它因为是一比一的比例的话,它能看得很清楚,但是这些小的蝴蝶的话,一比一的话就是一些斑纹,包括色彩。就很难看得很清楚,这方面就是在生态图间用生态照的话,一些小的蝴蝶的它。特征也看得比较清晰,我现在做的也就是。

一个生态的途径,我们我和我朋友大概拍了2100多种。中国蝴蝶的生态影像。然后。然后选了很多的图,然后都是选的最漂亮的最美美观的,而且它这个主要是有比较丰富的,这个比较清晰的鉴别特征,包括它这个蝴蝶的正反面性别型细节性亚种都是做了一个选图。比如说,你像蝴蝶的雄碟和磁碟。还有不同的亚种。还有正反面,包括季节的这个季节型,还有其他的一些基因型。这些典型的个体的照片我们都选进来了,大概有几万张图,最后选了都是非常好的图,然后包括还就是收录了一些就是非常多的,近几年的发现了一些蝴蝶的新种,还有新记录种。还有一些最新的分类层级的变化,比如说就是我们在云南发现了一种。

新记录的一个蝴蝶叫这个玫瑰艳会蝶这种蝴蝶挺有意思的,就是前几年有一年特别多,然后之后就是销声匿迹了,就是这几年就不太容易再找到了。很多蝴蝶都是有这种现象,有时候。运气特别好的话也能见到非常多,可能他有非常大的年纪的波动。就是我们在去年刚拍到的一种。这种蝴蝶是国内比较非常难见到的一种。这种蝴蝶就是只生活在这种海拔大概4000到5000接近雪线的地方。这是在唐古拉山口拍的,当时山边上还有雪,他们生活环境非常恶劣。一年中大概在7月份短暂的那么一小7月初,6月末的时候。非常短暂的一段时间才能见到。

然后除了这些大量的拍摄的图片,还有就是我们这个图片主要是想做辨识,就是说叫你去认。非常种类比较,外观非常接近的蝴蝶,怎么去区分我们重点。做了这些就是在书那书里面重点。阐述了这些内容。比如说我们除了它和标本图像不一样,我们很多特征就是用生态照就是你拿着相机拍下来以后,很容易就能分辨。比如说这两种蝴蝶的版本非常相似,但是它可以看到这个左边这个小破会和右边。破灰蝶它眼睛。颜色完全不一样的。你做了标本以后,它的眼睛会变色的,它色素会变色的,但是如果是你活生生的状态下拍下来的话,就很容易就可以把两种区分开了。所以说我们这本书。可能是喜欢生态摄影的,或者野外,就是在观鸟一样,拿着望远镜去看这个蝴蝶的。情况下非常容易能辨识的一些方法。

进行了一个介绍,包括可以看到这两种蝴蝶的它胸部的毛。颜色不一样,这也是以前这个生态图件它没有很少提及的,因为大家想象一下就是做标本的时候会把这个两个翅膀给它摊平,这个时候这个毛的话就已经被压在翅膀下了。就很难看到了,如果生态照的话,就很可很容易就通过这两种特征进行一个区分。

我们这个图片主要是除了这些生态照,还放了一些图示。把这些辨识特征的。都给你标出来了,对应到你文字描述里面。这样的话,很多人买了图片以后光看图不喜欢看这个文字。然后我们都是用非常凝练的语言写的。

粉丝这样的话。充分的提高这个图建的利用效率没有废话,然后如果你这个图看不懂的话,可以看这个文字对应它是如何区分的。我们这个书就是比较规模比较大,我感觉大部分人都不是特别喜欢这种大部头的图片。因为他拿着很累,翻翻的也很累,卖的也很贵。一般买回家以后一年可能翻不了几次,翻多了就容易翻烂了。大家还是喜欢小型的。小的随手的野外的手册可能更好一点。我当时也是这么想的,没办法。只有这个项目可以给我做,想把它做的好一点。

还有一个问题你翻图鉴的话,尤其像我们这种大波头有2000多种蝴蝶的话。如果你不熟悉蝴蝶的话,你很难就是11下子就能翻字典一样,一下就能翻到你想要找的那种。大家可以看这个图,很多这些蝴蝶它存在非常多的拟态的现象。比如说有些凤蝶,还有这些眼蝶,它长都是一样的,它可能分布在这个图片中的前中后随机分布的一些地方,你要想把这个去一下子就能看完,就是把书全翻完以后你才能。确定你是不是全都了解了这些类似种,而不是随便就选了其中一个比较像的就鉴定了?对于大部分的图像来说,去检索这些特定的种类的话,特别对于初学者来说是比较难的。

还有个什么问我当时就是做了一个设计,就是把每个属最典型的一些。个体的照片给它就是抠图抠出来,然后比如说白色的放在一起,然后这些黄色的或者斑点条纹的,按照这种检索的顺序,就像那种野花按颜色就是那种手册来做的那种小图件,我也想这样做一个这种检索图片形式的检索的一个。

检索表。我书非常大,非常难翻。时间就是做了很多图示以后觉得工作量非常大,效果其实也一般。就没有再做了,包括还有一个事就是让我耿耿于怀的就是我画了这么多分布图,本来想放图间里面。但是因为国内出版物,如果要放地图的话就非常麻烦。不光要去审核,要交很多钱。可能还要他们去给你画图,他们画的地图可能也不是很好看。所以说我也没办法把我画的这么多地图给它放到图件里也挺遗憾的。想为了解决这两个遗憾。

然后后来我就做了蝴蝶的用手机就可以,就是小程序可以识别蝴蝶,这样它其实就是一个初步的检索。你可以用手机随时随意的去对蝴蝶进行一个鉴定。把它这个范围锁定到那么几种,然后再去这个图件里面去仔细去翻,究竟这几个近似种之间有什么区别?然后这样我觉得用这种模式的话,就可能弥补大图建这大部头的。劣势吧。我这个小程序目前就是针对了。角度非常刁钻的还有一些。比较破损的。包括还有这些复杂的环境里面这些个体。

都做了一些算法的训练,傻瓜用起来都非常傻瓜,这个效果还可以。它其实训练的原理非常简单,就是你需要大量的图片。进行不同角度不同光线不同个体。这个图片进行一个模型训练就是深度学习的一个算法。现在用的也非常多了。没有什么可说的,目前我开发了这两个,一个是识别蝴蝶的大概能识别2000种左右。格子的话就更多了,能识别大概4000多个数。我觉得可能格子的这个意义更大一些,因为我不是特别懂格子,然后我学习过程中,这个对我来说也是一个非常大的帮助。

为什么你像右边这个图就是我一天晚上灯又拍了很多的格子。如果我想就是去翻各种科科,各种科的动物质去,还有一些途径去找,可能一晚上拍了照片,你可能找上半个月一个月都不一定能。完全鉴定完。

用我这个小程序的话。它可以自动的就是对蝴蝶进行一个照片进行整理。对它一个重命名之后,你可以去,如果你对哪个类型感兴趣,你可以去直接去搜索你这些图片,然后去。仔细去鉴定特定的一些类群,很快就可以把所有的图片就整理完成了。我感觉后续能让大家都用上这个方式。就可以非常好的调动这些图片的资源。

就拍这些灯的照片,非常容易,包括中坤那个时代很多,我看那个贴吧帖子里面很多都是拍灯,又各种蛾子。图片非常多,大家就是都让它烂在硬盘里面了,它没有数据,没有进行利用起来。包括左边就是我用蝴蝶方法,整理了一下额字的名录,目前。整理了大概有3000零三千多个数,就是中国有分布的三千多个数,一万多个种,其实这还是冰山一角,我只很多一些,那个文献我还没有加进去。这个东西最早是云鸟,云中鸟,它在做的一个事情。我觉得挺有意义,我就接过他这个活来我也来做了。还有一个前几天正好看群里有人分享这个就是做。

望远镜那个施华洛奇洛世奇开发了一个AI识别鸟类的一个望远镜,我觉得挺有意思的,包括前几天这个群里面有人说以后如果能用vision pro开开发一个就是野外找虫子,或者找一些什么东西的一些。那种应用,比如说你可能你你裸眼可能找不了。去发现一些虫子或者一些东西可能比较难,但是用这个算法可能很快就能告诉你哪儿有个什么虫子,然后你再走进去,就是靠近去拍拍清楚以后,它再给你鉴定出来是什么一个物种。

一步就能上传到云端去收集这些影像,我觉得都很有意思。包括年前正好就是我和朋友申报了一个腾讯公益一个技术就是一个项目。过了初审了,不一定能过想做一个。小程序能上传大家能上传观测记录并进行鉴定的就比较像。因为在中国是被抢了的,就是用的,用起来不是非常方便。包括他手机端用的也不是很方便。所以说我们想能不能就是把他这些比较优优良的一些经验给借鉴过来,我们就是开发一个就是我们用的比较方便的一个。一个平台。这样大家能都上传到网上去以后,就是能在云端进行一个鉴定,互相帮助。收集这些物种的影像。我觉得也挺好的。基本上是这样。

- -- -

发表评论

邮箱地址不会被公开。 必填项已用*标注