Nombre total de pages vues

mardi 5 janvier 2021

Le Distance Sampling pour les Nuls ...

Deux mille pouillots comptés le 26 mars 2016 en val d'Allier bourbonnais?  Vous êtes sûr du chiffre ? Vous les avez comptés un par un ? Qu'est-ce que c'est que cette histoire ?

la migration des pouillots,  ou comment compter des milliers d'oiseaux ...


Le printemps nous amène chaque année un flot de passereaux migrateurs, souvent très groupés, dès le mois de mars. La Réserve Naturelle Nationale du Val d'Allier, près de Moulins (03) - voir mon autre Blog http://ornithovaldallier.blogspot.fr/  - est particulièrement propice à l'observation de ces mouvements migratoires grâce à ses milieux très diversifiés.
Mais cela fait quarante ans que certains ornithologues - dont un des auteurs de ce Blog - se posent une question toute simple: combien y-a-t'il de pouillots, dans la réserve (ou ailleurs) , les jours de gros passage ? cent, mille, plus ?  Comment savoir ? la question se pose d'ailleurs pour tous les autres migrateurs: fauvettes, rossignols, etc ...

Où les méthodes scientifiques courantes montrent leurs limites ...

Sur de petites surfaces, l'ornithologue peut effectuer des comptages directs: ainsi, il est possible d'affirmer que sur certains bras morts, fin mars, sont présents simultanément des dizaines de ces petits oiseaux de retour d'Afrique.

Mais dès qu'il s'agit d'évaluer sur des surfaces plus conséquentes, çà coince ... Des techniques de comptages sur des parcours kilométriques (les "Line-Transects") existent: elles permettent d'obtenir des valeurs minimales: "21 pouillots sur 1 km", par exemple. Mais il est impossible de dire à quelle SURFACE correspondent ces chiffres, donc de transposer en densités. Tout au plus peut-on, si la semaine suivante on en observe 42 par km, affirmer qu'il y en a deux fois plus ce jour-ci...

Le "Distance Sampling" au secours du scientifique de terrain

Cette méthode mise au point par les ornithologues anglos-saxons il y a une quinzaine d'années n'a pas franchement la cote en France, et pourtant, elle le devrait ! Distance Sampling, çà veut dire "échantillonnage par la distance" (pas trouvé mieux comme terme en français).

Partons d'une simple constatation :  si on parcourt un milieu en détectant les oiseaux à la vue (à l’œil nu, les jumelles ne servant que pour confirmer) et à l'audition, il est évident que plus les oiseaux présents sont loin de l'observateur, moins ils sont détectables.
Il va donc falloir faire un peu de mathématiques : la fonction f(x) qui donne la probabilité de détection d'un oiseau en fonction de la distance d'observation est une fonction décroissante, avec la probabilité 1 si l'oiseau est à distance = 0, et la probabilité 0 quand l'oiseau est à la limite maximale de détection.

Le Distance Sampling consiste donc à parcourir un milieu dans de bonnes conditions (vitesse régulière, météo correcte), et à noter non pas seulement le nombre d'oiseaux rencontrés pour une espèce donnée (ce qui s'appelle un Indice Kilométrique d'Abondance ou IKA) , mais aussi sa distance par rapport à l'observateur.





Les données de distance obtenues  sont alors regroupées par classes (intervalles), ce qui donne le graphe suivant (nombre de données en fonction de la distance): bleu données de terrain, rouge courbe théorique (voir plus loin).




Ce diagramme présente, par intervalles de distance de 20 mètres, la probabilité de détection de 103 pouillots contactés le 26 mars 2016 le long d'un parcours d'un peu plus de 4 kilomètres dans la Réserve du Val d'Allier par F. Guélin. On peut noter que la fonction de détection est effectivement décroissante, mais pas de manière linéaire. Les théoriciens du Distance Sampling - voir bibliographie en fin d'article - ont démontré qu'il existe une modélisation mathématique possible et "robuste" sous la forme d'équations polynomiales (assez complexes, mais nous n'avons pas besoin d’en savoir plus).

Heureusement ces ornithomatheux ont conçu un logiciel d'analyse gratuit - Distance 6.2 - qui traite les données, calibre la courbe de détection (ci-dessus en rouge), et permet l'extrapolation des données à une surface ! Sur quel raisonnement se base le logiciel ?
A partir de deux repères fondamentaux, à savoir la distance=0 où TOUS les pouillots sont considérés comme étant détectés, et la distance maximale (donc l'observation la plus lointaine de la série, ici 200 mètres), le logiciel trace la courbe de détection, ce qui permet d'extrapoler à la surface du rectangle constitué du tracé du "transect" rectiligne, sur deux fois la largeur de détection. En effet les 103 pouillots ont été notés sur une surface de 4,38 km x (2 x 200 m) dans le cas présent (soit 175 ha). Et, c'est bien visible ci-dessous, il est mathématiquement simple de calculer les pouillots NON DÉTECTÉS, si l'on suppose une répartition homogène sur la surface totale...



Qu'est ce que çà donne comme résultat ?

Grosso modo, on voit bien sur le graphe ci-dessus que la surface totale du rectangle (qui est proportionnelle à TOUS les pouillots présents sur la surface de recensement) fait plus de 2 fois la surface cumulée des colonnes du graphe: 103 pouillots notés mais il y en a probablement plus de 200 (autrement dit, l'ornithologue en a loupé la moitié !).
La zone prospectée ce jour là couvre environ 145 hectares, choisis pour être représentatifs des 1450 hectares de la RNVA.

Le logiciel nous permet donc d'évaluer à 221 pouillots la densité sur les 145 ha de comptage (avec une fourchette d'effectifs de 153 à 320 individus dans l'intervalle de confiance statistique de 95%). L'extrapolation à toutes la Réserve Naturelle s'effectue en multipliant par 10: soit 2210 pouillots sur l'ensemble de la RNVA ce jour-là ...


Quelques détails pratiques pour mieux comprendre ..

Concrètement, cette méthode nécessite une préparation assez conséquente: ainsi il a fallu réaliser pendant plusieurs journées les repérages pour les quatre kilomètres de "transects" durant l'hiver 2015-2016, en repérant bien le terrain, et en décrivant les milieux pour qu'ils soient représentatifs de l'ensemble de la RNVA (carte ci-dessous, vous remarquerez que la zone d'étude est entre le Paradis et les Rognons). Les transects utilisés sont les cinq trajets visibles dans la partie sud en rive gauche vers "TILLY" (réalisés en une matinée).



Matériellement, mesurer la distance d'un oiseau par rapport à l'observateur passe par l'utilisation d'un plan (ici un plan papier au 1/2000ème, les systèmes numériques étant encore inadaptés). Trajet en vert, et rouge en cas d'impossibilité !)



Il faut avoir l'habitude des techniques de comptages d'oiseaux pour faire ce travail, c'est évident, mais avec l'expérience, le Distance Sampling par transect s'avère très agréable. Une fois à la maison, avec règle et tableur, on met en fichier les résultats obtenus pour le traitement logiciel.

Pour une autre espèce, le rouge-gorge, notée et "mesurée" le même jour (seulement 32 données) que les pouillots, la modélisation donne les éléments suivants :


Le logiciel donne le nombre total de rouge-gorges sur la zone (ici c'est une zone plus large de 242 ha correspondant à 9 transects au lieu de 5 seulement pour les pouillots). Ce chiffre est de 110 (71 à 168). Il exprime aussi ce chiffre en densité à l'hectare (0.45329). Extrapolé à la RNVA, on obtient une estimation de 660 rouge-gorges ce jour-là, soit un beau pic migratoire de fin mars ...


Bref, si cette technique vous tente, continuez de lire ce Blog, qui vous propose plus de détails en colonne de droite.

Et n'hésitez pas nous écrire !

11 commentaires:

  1. Bonjour,

    Merci beaucoup pour ce partage de méthode ! Très instructif!
    En revanche, je rencontre une difficulté de mise en oeuvre quant à la surface à entrer dans les données de base.
    En effet, faut-il renseigner la surface prospectée (échantillon de l'unité de population recherchée) ou bien la surface de cette unité de population?
    Reformulé avec l'exemple de la RNVA, faut-il rentrer 145 ha ou bien 1450 ha ?Dans l'exemple, du line transect RNVA, dans le tutoriel, il semblerait que vous entriez la surface de l'unité de population, soit 1450 ha. Or, dans les résultats, la densité donnée est égale à N/S échantillonnée = 221/145= 1.52 ind./ha. Je ne comprends pas car, quand je réalise cette analyse sur un de mes jeu de données en renseignant la surface de l'unité de population, la densité renvoyée est égale à N/S unité de population et donc largement inférieure.

    Merci d'avance de votre réponse.
    Bien cordialement,
    JB FANJUL

    RépondreSupprimer
    Réponses
    1. Bonjour

      oui en effet, la "stratum area" est la zone d'EXTRAPOLATION. Pour cet exemple en particulier, c'est probablement mal expliqué: en effet pour les pouillots, çà se fait sur un seul jour, et donc sur un seul méandre de 145 ha. Dans ce méandre, les 4,32 km de transects donnent 103 contacts de Pouillots, que le logiciel estime à 221 au total, sur la surface du méandre de 145 ha. Ensuite, j'ai considéré que le méandre était LUI AUSSI représentatif des milieux de l'ensemble de la RNVA (1450 ha) et il suffit donc de multiplier les résultats par 10. Par la suite, j'ai réalisé des transects dans près de douze méandres , pour extrapoler directement à 1450 ha, ce qui est plus sur.

      Ceci dit, le logiciel procède de la manière suivante (je crois): à partir de la répartition des données de mesure (et surtout des données à courte distance), et du coefficient de détection (calculé à partir de la courbe statistique), ainsi que de la largeur du champ de détection (ici 199 m), il calcule une densité à l'hectare, dans le rectangle au milieu duquel chemine le transect (donc un rectangle de 4.32 km x 2 x 0.199 km). C'est cette valeur qui est fondamentale. L'extrapoltaion pourrait se faire ensuite sans le logiciel, à la calculette .

      Ensuite, si je comprend bien votre protocole : les 4 transects de 25 km sont censés être un échantillonnage systématique d'une grande zone de 18 900 ha (c'est çà ?).

      La densité D obtenue par le logiciel est donc donnée à l'hectare (si c'est cette unité que vous avez choisie). Et ensuite en x par 18900 vous avez la fourchette d'estimation pour l'ensemble du massif , SI vous considérez que cette extrapolation est valable (donc que les 100 km de transects - bravo - sont représentatifs).

      La zone échantillonnée (celle dont le logiciel exprime la densité) se calcule ainsi: un rectangle de 100 km (4 x 25 km) de long sur 2 fois la distance maximale de détection (que je ne connais pas). Mais cette surface est en réalité peu utilisable.

      J'espère que mes explications sont compréhensibles

      Cordialement

      F. GUELIN

      Supprimer
  2. Bonjour,
    Site vraiment très utile, merci pour l'initiative. Mais existe-t-il un manuel d'utilisation du logiciel Distance 7.2 en français (une traduction du guide disponible en anglais sur le site de référence)? Merci pour la piste éventuelle.

    RépondreSupprimer
    Réponses
    1. Bonsoir,
      hélas non, il n'existe pas de manuel d'utilisation en Français ... et c'est parfois difficile de comprendre les nuances de cette méthode dans la notice anglaise. Mais n'hésitez pas à contacter les concepteurs (université d'Edimbourg)sur le site Distance, ils répondent toujours dans des délais brefs à toutes nos questions (ou presque ....)
      Cordialement
      FG

      Supprimer
    2. Bonjour Francois, puis je avoir le logiciel distance compatible avec mon Mac. mais suis aussi nul en distance. je vais faire de l'autodidactie, avez vous un manuel qui peut m'etre utile pour s'en sortir?

      Merci urbain

      Supprimer
    3. Hélas, j'ai bien peur que sur Mac .... Bon, il faut aller voir sur le site http://distancesampling.org/ et regarder configurations disponibles, et éventuellement poser la question sur le Blog de ce site (en anglais). A ma connaissance , aucune notice en français pour ce logiciel. Désolé
      F Guélin

      Supprimer
  3. Merci pour la réponse. Je suivrai le conseil. Cordialement, CM

    RépondreSupprimer
  4. Bonsoir. j'espère que vous allez bien et merci pour cette initiative qui nous permet de renforcer nos capacités dans le domaine du suivi écologique. j'ai récemment effectuées un exercice de dénombrement par line transect dans un parc. il m'arrivait parfois de tomber sur plusieurs individu de la même espèces pour une seule observation. je constate que dans la bas e de données quel'on insère dans Distance on ne notifie pas le nombre d'individu détecté par observation. selon vous, est ce que cela n'a pas un effet sur l'estimation du nombre et de la densité par le logiciel. Si ce n'est pas le cas, alors quelles usages pouvons nous faire du nombre d'individus enregistré pour chaque observation?

    RépondreSupprimer
    Réponses
    1. Bonsoir
      Quand on observe plusieurs individus groupés de la même espèce, ils sont effectivement à même distance, et il faut les placer individuellement dans le tableau: une ligne par individu. Ceci étant dit, en période de reproduction, il ne doit pas y avoir de "groupe" d'individus s'ils s'agit d'espèces territoriales (?). Pouvez vous m'en dire plus ? S'il s'agit d'un dénombrement hivernal, vous pouvez utiliser l'analyse par "cluster" (!) , avec un tableau qui donne la distance de chaque groupe et son effectif.
      Vous pouvez m'écrire directement sur guelin.francois@gmail.com

      Supprimer
  5. Bonjour,

    Méthode très intéressante mais j'ai quelques questions. L'homogénéité de l'habitat doit-être très importante j'imagine. En effet dans un forêt très homogène cela me semble être une bonne application. Pour le reste je ne vois pas comment cela peut-il être représentatif de la réalité ! Ainsi les limites se heurtent à la configuration du terrain j'imagine. 2nd question, la capacité de détection des oiseaux varient en fonction de leur nombre réel, de leur taille, de leur "farouchisité" comment ont ils implémentés le biais d'espèces ? Merci pour votre réponse et merci pour votre article !

    RépondreSupprimer
  6. Bonjour Anonyme :)
    Pour votre première question: non, il n'est pas nécessaire d'être dans un milieu homogène. Nous avons étudié des zones extrêmement hétérogènes (où, justement, aucune autre méthode n'était possible), et les estimations portent donc sur l'ensemble de la zone étudiée, tous milieux confondus. Les populations d'oiseaux peuvent être réparties de manière hétérogène, mais ce qui est important c'est que les points d'échantillonnage soient placés au hasard.
    Ceci dit, c'est plus intéressant de travailler sur de grandes zones représentatives de "paysages" (bocage, forêt de feuillus de différents âges, etc ...)
    Pour votre deuxième question, c'est simple, la méthode du DS est justement conçue pour ça ! elle permet d'obtenir des probabilités de détection pour chaque espèce (et elles sont, évidemment, très variables). Ces proba de détection dépendent de nombreux paramètres, qu'on peut même détailler en utilisant certains modules du logiciel.

    RépondreSupprimer

Contactez-nous :