新闻动态

香农-维纳多样性指数何以能够指示水体健康状况?

wseen 2023-8-29 9:02:43

水生态文明建设的关键是恢复并维持自然水体健康,科学合理地评估水体健康状况无疑是至关重要的。为了评估水体健康状况,科学家们提出了许多指数。在众多指数中香农-维纳多样性指数脱颖而出(生物完整性指数后来居上)。在2023年生态环保部发布的《水生态监测技术指南 湖泊和水库水生生物监测与评价(试行)》(HJ 1296-2023)中提出了香农-维纳多样性指数评价分级参考值(表1)。现有大量期刊论文中也将香农-维纳多样性指数与水质关联起来,认为香农-维纳多样性指数越高,水体污染程度越低。


备注:该参考值的H计算公式以2为底
那么香农-维纳多样性指数是如何起源的呢?又是如何能够应用于水生态并表征水环境质量的呢?

1、香农指数的起源

香农指数又称香农熵或信息熵。1948年贝尔实验室通讯技术电子工程师克劳德•香农(Claude Shannon, 1916-2001)在《贝尔系统技术杂志》(Bell System Technology Journal)分两期发表了信息论开山之作《通讯的数学理论》(A mathematical theory of communications,1948)。在这一重磅文献中,他引进“信息熵”的概念来衡量通信系统效率。从概念上来讲,将信息定义为可能事件或消息的概率分布对数的负值,每个事件的信息量构成一个随机变量,其期望值或平均值为香农熵。简单理解就是香农熵用来描述不确定事件的不确定程度,是随机变量不确定度的度量。随机变量不确定度越大,熵越大;反之越小。
公式1:

1949年香农和维纳在University of Illinois Press出版的《通讯的数学理论》(A mathematical theory of communications,1949)一书中再次系统介绍了信息熵,信息熵的概念在更大范围内得以推广。基于这样的原因,香农熵也被称为香农-维纳熵。
香农对信息理论的表述在通信工程应用中立即获得了成功,此后它激发了将信息理论应用于其他各个领域的尝试,如认知学、生物学、语言学、心理学、经济学和物理学。

图1 Claude Shannon
2、香农指数应用于生态学
20世纪初期,如何定量分析生物群落结构是生态学家们关注的重点内容,后来被称为现代生态学创始人之一的西班牙生态学家和自然学家Ramon Margalef也是其中的一员。
Ramon Margalef于1919年5月16日出生在巴塞罗那,很早就对淡水生物的观察表现出了浓厚的兴趣。1943年后不久,他得到了西班牙研究委员会(CSIC)的资助,并进入了应用生物研究所(Instituto de Biología Aplicada)从事浮游植物研究。1949年,他获得了自然科学学位。1951年,在马德里大学提交了他的博士论文后,Ramon Margalef成为该研究所的研究员。

图2 Ramon Margalef
Ramon Margalef十分擅长用数学方法表达生态学中的现象与规律。1951年,Margalef为了定量分析生物群落结构,在前人的工作基础上建立了一个新的指数,即“马格列夫多样性指数”(Margalef diversity index)。
公式2:

公式3:

公式3相比公式2更常用。公式2和公式3中,S是物种数,N是总物种个体数。马格列夫多样性指数也是生态学中常用的指数,但是该公式的缺点也十分明显:马格列夫多样性指数(d)结果完全依赖物种数(S)和总丰度(N),而对缺乏对各个物种丰度的关注,偶见种和常见种对结果的影响是一样的。如图3群落A与群落B物种数和总丰度一样,因此马格列夫多样性指数完全一样,但是两个群落的物种组成完全不同。尽管该指数在后续工作中被其他生态学家广泛引用,但是Margalef本身对其并不满意,并认为物种数与丰度之间的关系需要更多的统计学上的研究。


图3 马格列夫多样性指数案例
1956年Margalef在去北美交流中,他首次谈到将信息理论的概念应用于生物体群落的结构和动态研究。这个想法很快吸引了现场听众,这也给了Margalef更多的动力把香农的公式介绍给更多的生态学家。1956年,他在分析维哥和卡斯特利翁的海洋浮游植物的数据时,明确地将多样性表达为信息和熵。但是在这里,他采用了新的公式来计算多样性指数。
公式4:

在该公式中N为总丰度,S为物种数,Ni为物种i的丰度。该公式终于如Margalef所愿既考虑了物种数也考虑了每个物种的丰度。从结构上来讲,该公式与香农熵公式(公式1)已经很接近了,并且在模拟数据(S=5,N=100的所有物种分布组成)上显示二者的结果具有极显著的负相关关系(r = -0.94,P<0.001)。
虽然此时Margalef已经注意到了1953年出版的《Information Theory and the Structure of Proteins》一书中已经采用了香农熵公式来计算蛋白中氨基酸的多样性,并指出信息理论对于从一个科学领域概括到另一个科学领域特别有用。然而此时Margalef并没有比较香农熵公式与自己的公式之间的异同。
我们采用模拟数据比较两个公式发现,对比香农熵公式(公式1),Margalef新的公式(公式4)存在着一些不足:(1)其结果与人们直观感受相反,在香农熵公式当物种数S和N一定时,物种分布越不均匀,香农熵越高,而在Margalef新的公式,物种分布越不均匀,其结果越低;(2)其结果值域分布范围太窄,在同样的模拟数据中香农熵的范围是0.22-1.61,而Margalef新的公式则是3.49-3.59,值域会影响区分不同群落结构的差异(图4)。

图4 S=5,N=100模拟所有可能的物种分布(共计38225条数据)。
A,香农熵;B,Margalef新的公式结果
1957年,或许是对自己新创公式的不满,Margalef用西班牙语发表了“La Teoría de la Información en Ecología”,首次建议将香农熵应用于生物多样性研究。该文章一经发表便广受欢迎,以至于第二年又用英文把文章重新发表了一遍(Information theory in ecology),这种一稿多投的现象是十分罕见的,这也从侧面说明大家对这篇文章的追捧。此后香农熵正式进入生态学领域成为香农-维纳多样性指数,并在生态学领域大放异彩。

3、香农-维纳多样性指数的生态学意义
香农-维纳多样性指数描述物种的个体出现的紊乱和不确定性的指标。如果一个群落只包含一个物种,不确定性为零,因为我们确信随机选择的个体属于那唯一的一个物种。群落中物种越多,不确定性就越高;在一个多样化的群落中,我们不太可能猜到随机选择的个体属于哪个物种。然而,如果群落有许多物种,但只有一个(或几个)占优势,不确定性就不会那么高,随机选择的个体更有可能是数量最多的物种。这就是为什么香农-维纳多样性指数随着物种数和均匀度的增加而增加,并且物种数对其影响更大。因此香农-维纳多样性指数引入生态学领域用于评估群落生物多样性是十分合适的。
在三个模拟生物群落中,所有群落物种数和总个体数相同,群落A所有物种完全均匀分布,群落B中物种并未完全均匀分布,但是也没有出现绝对优势种,群落C中物种完全不均匀分布,绝对优势种的丰度占据了群落的大多数。在三个群落中香农-维纳多样性指数随着物种均匀度的降低而降低(图5)。


图5 物种均匀度与香农指数的关系

图来源于Analysis of community ecology data in R (作者:David Zelený)

4、香农-维纳多样性指数又是如何能够表征水环境质量的
当用香农-维纳多样性指数表征物种多样性的时候,通常没有问题。一般来说香农-维纳多样性指数越高,那么群落中物种丰富度和均匀度越高,对应的物种多样性越高。然而香农-维纳多样性指数又是如何与水质指标关联起来的呢?
在生态学领域有一个关于群落稳定性的重要理论,即群落稳定性包括恢复力稳定性和抵抗力稳定性,群落多样性越高那么抵抗外界干扰能力越强。物种多样性越高,生态稳定性越高,进而生态系统功能和服务的可持续性更好。当污染发生时,各物种因为敏感性不同,对于污染物的响应也不相同,原有的群落结构必然发生变化。通常来看,某些物种会消亡,而某些耐污种的丰度可能会快速上升,从而导致物种多样性降低。总体来看,在自然水体中,香农-维纳多样性指数越低,污染程度越高,反之亦然。
但是,当我们在使用香农-维纳多样性指数表征水环境质量或者水体污染程度时还是需要十分谨慎。具体实践来看,不同的生物类群、不同的物种鉴定结果、不同的采样深度以及样点的具体分布都可能会影响香农-维纳多样性指数。因此香农-维纳多样性指数是否能够准确反应水体污染程度还需要结合其它指标具体研究。


参考资料

Shannon, C. E. A mathematical theory of communication. The Bell System Technical Journal, 1948,27(3)

Shannon, C.E.; Weaver, W. The Mathematical Theory of Communication; University of Illinois Press: Urbana, IL, USA, 1949.

Sherwin W.B., Prat I Fornells N. The Introduction of Entropy and Information Methods to Ecology by Ramon Margalef. Entropy (Basel). 2019, 21(8):794.

Margalef, R. La Teoría de la Información en Ecología. Mem. Real Acad. Cienc. Artes Barc. 1957, 32, 373–449. (In Spanish)

Margalef, R. Information theory in ecology. Gen. Syst. 1958, 3, 36–71.

David Zelený. Analysis of community ecology data in R. https://www.davidzeleny.net/anadat-r/doku.php/en:div-ind

转自
水生生物数据分析管理平台IHB