Jump to content
Quelques-uns des principaux sujets de Géoforum. - Pistolet nettoyeur haute pression pour minéraux et fossiles.


Bourse minéraux Sainte Marie aux Mines 2019, avec fossiles et gemmes.
Bourse minéraux et fossiles de Sainte Marie aux Mines (Alsace) - 27>30 juin 2019

Principaux sujets de Géoforum. - Pistolet nettoyeur haute pression pour minéraux et fossiles.


Bourse aux minéraux et cristaux de Bourg d'Oisans (Isère).
Fête des minéraux et bijoux de l'Oisans du 3 au 5 mai à Bourg d'Oisans (Isère)
Fred_V

Identification de minéraux par Machine Learning

Recommended Posts

Bonjour à toutes et tous, nous (start up impliquée dans du développement logiciel pour la recherche scientifique) sommes en train d'évaluer différentes méthodologies d'identification d'objet ou de classification grâce au traitement d’images via des réseaux de neurones.

En consultant ce forum je me rends compte que le besoin d'identification de minéraux est une activité  de communication inter membres très utile, mais il me semble qu'il serait intéressant d'évaluer les capacités (et certainement les limites) de l'identification de minéraux via du Machine Learning, et si le niveau de performance est suffisamment élevé de mettre ceci à disposition de la communauté.

SI l'une ou l'un d'entre vous a déjà une ou des expériences dans ce domaine, je suis prêt à en discuter.

Si de même certaines / certains d'entre vous ont des séries d'images qualifiées (c'est à dire classifiées de façon certaine) nous sommes preneur, a minima pour un essai entre 2 classes ou plus.

Au plaisir de lire vos feedbacks

Bonne journée à toutes et tous.


 

Share this post


Link to post
Share on other sites


Bonjour,

 

Bonne initiative, déjà testé la recherche d'images de Google qui n'est pas vraiment faite pour ça...

Qu'entendez-vous par "classifiées" et "classes" dans votre dernière phrase ?

 

Pas de soucis de ma part pour vous fournir des photos de minéraux identifiés.

Il existe aussi des bases de données desquelles vous pourriez vous rapprocher (Géowiki, Mindat, Wikimedia...).

 

JeF

Share this post


Link to post
Share on other sites

Merci Pablo pour cette proposition je vais regarder.

 

Pour répondre à José, ici classification = identification d'une image comme appartenant à une classe ou à une autre, dans le cas où on n'en a que deux.

Par exemple,  hors contexte minéralogique, une abeille mellifère par rapport à un bourdon......un de nos derniers essais d'ailleurs.

 

Toute photo soumise sera par contre classifiée entre ces deux classes, même si elle n'a rien à voir !

 

Si, avec peu de classes, on a une quantité d'images par classe suffisante, on doit arriver en principe à un  niveau de prédiction correct.

 

Si on étend ceci à un nombre de classes très important, on peut arriver ensuite à identifier nettement plus de types d'objet et on rajoute alors une classe "divers ou poubelle" pour les photos qui ont une plus forte probabilité d'appartenir à quelque chose de non connu par l'algorithme qu'à une quelconque classe connue..  Mais ce niveau d'efficacité est long à obtenir.

SI vous avez des photos de différents minéraux, en avez vous une quantité importante par type  ( plus de 50) ?

Si oui on peut déjà essayer avec 2 types (ou classes ici)

 

 

Share this post


Link to post
Share on other sites

Quelle est votre niveau de définition dans une classe, et quel y est le delta d'écart acceptable entre chaque individu de la classe ?

Prenons l'exemple du Quartz cristallin : cristal isolé ou sur gangue, seul ou en groupe, prismatique ou trapu, transparent ou translucide, incolore ou coloré, photo sur fond neutre ou pas... ?

 

JeF

--------

Bonne question sur les fossiles, ça me semble plus pertinent et plus proche de ce que vous avez déjà essayé avec les abeilles (les espèces vivantes sont plus faciles à "classer" macrographiquement).

 

Pour revenir aux Quartz, voici une page qui en détaille les différentes variétés/morphologies, sans parler des provenances : http://www.quartzpage.de/

 

JeF

Share this post


Link to post
Share on other sites

réponse pour JeF s'appliquant en partie pour elasmo.

 

La classification de l'image est apprise (c'est l'étape d'entrainement du réseau de neurones) et c'est cet apprentissage qui permet, ou pas, de différencier une image dite cible. (image non utilisée lors de l'apprentissage)

 

D'autre part  l'image est vue par le réseau de neurone de façon à la fois globale et détaillée, ce qui veut dire, que si on lui montre dans la phase apprentissage toute une série de photos de granits sur un bureau coloré en vert, et du basalte sur un bureau coloré en beige, il est fort probable qu' un basalte sur un bureau vert soit identifié comme du granit à 90% de niveau de confiance !

Donc si le quartz cristallin n'est représenté que sur dans une des combinaisons indiquées (par exemple isolé prismatique sur un fond neutre), seul ce cas  a des chances d'être correctement reconnu ensuite.

Pour les fossiles, même observation, on doit très certainement, moyennant assez de photos, apprendre un ou quelques cas mais il faut clairement faire quelques essais d'abord sur une quantité de photos d'un même type de fossile A, avec certaines d'un deuxième type B pour déjà voir si on peut distinguer A de B.

 

 

Share this post


Link to post
Share on other sites

Des images ne suffiraient donc pas? pcq la diff entre danburite, quartz, topaz incolore etc si la photo est mal prise déjà un gars qui s'y connait, j'en connais qui ont hésité... le logiciel va pas aider, donc peut être rajouter pour id, au moins dureté densité? (+- x d'erreur)

pourquoi ne pas faire une id via la forme, les modèles sur mindat sont assez complets, faut juste que le logiciel arrive a voir les faces et les arêtes par contre

Share this post


Link to post
Share on other sites

Bonjour,

 

même si l'idée est plaisante je ne pense pas que ce soit réalisable et surtout fiable pour les minéraux vu la diversité de forme et de couleur pour chaque espèces !!  c'est déjà pas toujours évident pour un connaisseur avec le minéral en main de donner un nom à 100% alors juste sur une photo ??

 

Bien sur pour les espèces bien formé avec des cristaux net ça peut marché mais l'œil y arrive aussi et donc pas vraiment intéressant dans ce cas sauf pour les débutants .

 

à plus ……………….. 

Share this post


Link to post
Share on other sites

Mêmes objections que les collègues, mais y'a des chances que le système s'améliore avec l'expérience.

Comme évoqué dans le post initial, les limites risquent d'être vite atteintes : en effet si le but est d'identifier une espèce classique avec un habitus classique, ça ne servira pas à grand chose. Mais peut-être qu'au fur et à mesure des différentes photos vues la distinction d'une provenance sera possible (ce qui est nettement plus intéressant).

 

Google image sait le faire sur du très basique, mais si la solution proposée ici apprend, et notamment avec un calibrage constant au fil des photos proposées, et affine sa vision ça peut apporter quelque chose.

 

Néanmoins il faut savoir que chaque spécimen est unique, mais également qu'un spécimen peut-être visuellement plus proche d'un autre spécimen venu de l'autre bout du monde que d'un autre spécimen issu de la même poche...

 

JeF

Share this post


Link to post
Share on other sites

Il faudrait définirr ensemble quel est précisément le but (même si celui-ci est sans doute appelé à évoluer) du système.

 

Et pour le kif, un petit exercice de classification simplement visuel (2 espèces différentes, de 3 provenances) :

 

1 image.png.17c0439f190a46c21339d72ca170ae94.png

 

2 image.png.a247dd2a1abf0c0064f6801ff2f7a072.png

 

3 image.png.5f96c6dda0e0542668e809cd7a94cde3.png

 

JeF

Share this post


Link to post
Share on other sites

En effet, en lançant ce sujet, je me doutais que, d'une part je n'étais pas le premier à y penser et que d'autre part, la variabilité de l'aspect d'une roche (qui existe aussi dans le vivant, regardez par exemple les formes/coloris, textures des orchidées) était le principal obstacle à un progrès rapide.

 

Donc,  si quelque chose doit être lancé, il faut lui donner des objectifs très humbles et donc viser en première intention à une utilité pour grand débutant en minéralogie seulement.

 

Ensuite le post de JeF est exact, ce type de système est conçu  pour apprendre, même si dans un tel cas (et nous avons eu le même souci dans d'autres domaines) il faut avoir fréquemment accès à des "experts"  pour que la base d'apprentissage augmente régulièrement par lot de nouvelles "notions" (en fait par des jeux d'images qualifiées qui modifient les paramètres du réseau de neurones. Et pour en rajouter, cet apprentissage n'est jamais terminé puisque l'humain ""expert" va ici, via l'obtention de données additionnelles non photographiques (chimiques, dureté...), cerner plus rapidement une classe donnée.

 

A suivre donc.

 

Share this post


Link to post
Share on other sites

Tu peux toujours tenter l'expérience cela ne mange pas de pain, même si cela risque de prendre du temps.

 

En tout cas tu as mes encouragements, c'est ce qui manque un peu sur le forum en ce moment.

 

Si tu veux faire des tests sur les fossiles, pas de soucis, j'ai de quoi te fournir des photos identifiés (coquilles, dents, etc...)

 

Jean-François

Share this post


Link to post
Share on other sites

Je vais essayer de voir ce que j'ai en stock comme photos, en en décrivant au mieux le contenu.

 

On comprend que ça ne sera pas un Graal de détermination, déjà pour des humains sur photo on peut être sûr à 100% seulement pour des espèces classiques, à 90% pour des provenances classiques ou des espèces moins courantes, donc ces marges d'erreur concernent disons 5 à 10% en nombre d'espèces et sites déjà connus.

Pour tout le reste il faudra soit d'autres photos, soit un test de la part du questionneur voire un examen plus poussé de la part d'un spécialiste, soit accepter l'éventualité de ne pas être sûr à 100% de la nature/origine de ce qui est à identifier.

 

Il faudrait que, pour une demande, l'IA puisse travailler sur plusieurs photos du même spécimen (en macro et micro), et qu'un peu comme Akinator elle puisse réduire les possibilités en faisant participer le demandeur, notamment avec des tests physiques qu'elle proposera selon le niveau d'inférence atteint.

Mais cela sous-entend déjà une base de données photographiques énorme liée à un moteur de déduction basé sur les propriétés de chaque espèce et les caractéristiques de chaque site d'origine (et constamment màj selon les découvertes futures), en prenant en compte le taux d'erreur du valideur humain (qui me semble déjà nécessaire dans une première phase, mais aussi tout au long de la vie du projet).

 

Comme dirait elasmo : bon courage ! :content::content:

 

JeF

Share this post


Link to post
Share on other sites

Merci pour votre soutien ...à l'idée ....et vos encouragements pour le travail à faire !

 

De ces quelques échanges, il me semble effectivement judicieux de commencer par quelques "classes" de fossiles, je retiens donc la proposition d'Elasmo.

Celle de JeF dans un deuxième temps, car nos ressources ne sont pas illimitées, pour ce qui est à ce jour pour nous uniquement un travail de recherche appliquée.


Étant nouveau sur ce forum, je ne sais pas quel mécanisme d'échange de données entre membres existe (si il y en a un) et si c'est l'usage ou pas de donner ses coordonnées mail / tel

 

J'attends le prochain post avec intérêt pour statuer

 

A bientôt

Share this post


Link to post
Share on other sites

Bonjour

 

Je ne sais pas si je vais correctement formuler ma pensée, mais je voudrais connaitre les caractéristiques à prendre en compte pour que cela fonctionne avec des photos, doivent elle être d'une certaines qualités, tailles, ou autres ?

 

Pour ce qui est de l'échange des informations il est préférable de se les transmettre autrement que par le forum, par exemple en les stockant sur un serveur dédié

 

En tout cas je suis très intéressé de voir ce que donnerait une telle expérience, je me pose la question depuis des années, mais la technologie n'étant pas encore née, cela me semblait impossible, comme quoi on ne peux jamais dire jamais

Share this post


Link to post
Share on other sites

Réponse pour elasmo,

 

A priori on va essayer de s'adapter au format et à la résolution (nombre de pixels) des images.

Nos expériences sur des éléments du vivant montrent que l'on peut même parfois pallier à une image partiellement nette (premier plan par exemple) et floue sur d'autres zones de l'image.

L'algorithme ne donnant de toute façon qu'une probabilité que l'objet à classer ou localiser et classe sur l'image soit d'une certaine classe. Si l' image est très nette la probabilité est nettement supérieure à une image floue.

 

La notion de quantité d'images pour une même classe est elle plus critique...mais nous n'avons pu encore tirer beaucoup de conclusions sur le nombre mini (et maxi) par classe, sans avoir essayé sur un domaine.

 

Pour le transfert de fichiers, on peut essayer de passer par Wetransfer, ou sinon je peux demander à l'équipe de prévoir un espace accessible à distance avec sécurisation par mot de passe.

 

A vous de me dire ce que vous préférez faire.

 

 

Share this post


Link to post
Share on other sites

Super, si vous pouvez m'en indiquer l'adresse et si vous souhaitez logiquement protéger ceci via un mot de passe me l'envoyer via un autre canal, mon e-mail est frederic.viart@wanadoo.fr

 

 

Share this post


Link to post
Share on other sites

désolé, le lien http ne semble pas exister (erreur 404), mais vous lui aviez peut-être donné une durée limitée et je 'n'ai pu essayer d'aller le récupérer que ce matin.

 

 

Share this post


Link to post
Share on other sites

C' est OK je viens de les récupérer merci. Je regarde ceci avec l'équipe ici et vous tiens informé.....avec sans doute des questions dans un premier temps.

Share this post


Link to post
Share on other sites

Autant pour les fossiles cela ne devrait pas poser de problèmes  autant pour les mineraux c'est impossible :

      -principe de base : tri suivant base de données/apprentissage de mineraux...MAIS

                -autant pour les fossiles ce sont les formes en jeux (si la photo est bonne, la determination sera bonne) autant pour les mineraux c'est bien plus complexe

                       -on part de deux photos : une serpierite, l'autre devilline : forme, arrangements identiques la majeur partie du temps (sauf si les terminaisons sont visibles ce qui est rare) distinction possible dans certains cas sur le nuance de couleur ........................mais pour cela , encore faudrait t'il que les nuances subtiles de couleur respectent strictement la balance des blancs !!!! quid des minéraux de terres rares qui varient de couleur en fonction de la longueur d'onde de la lumière (pas même couleur en lumière du jour à midi ou un soir d'hiver....)

                D'autre part la distinction se ferait par formes/couleur par exemple mais comment faire pour deux especes identiques en formes et couleur ??? etc. etc

Share this post


Link to post
Share on other sites

Join the conversation

You can post now and register later. If you have an account, sign in now to post with your account.

Guest
Reply to this topic...

×   Pasted as rich text.   Paste as plain text instead

  Only 75 emoji are allowed.

×   Your link has been automatically embedded.   Display as a link instead

×   Your previous content has been restored.   Clear editor

×   You cannot paste images directly. Upload or insert images from URL.



×
×
  • Create New...