Ce document a été réalisé par l'équipe CISMeF.

Résumé
Prix, partenaires et financements
Mots-clés (MeSH)
1. Introduction
2. Matériel et méthodes
   2.1. Matériel et logiciel
    2.2. Standards

3. Réalisation du catalogue
    3.1 Le caractère francophone
    3.2. Le recensement des sites et des documents
    3.3. Filtrage et sélection : comment l'information est validée
    3.4. Description et indexation
    3.5. Structure du catalogue, classification
4. Résultats
    4.1. Statistiques d'utilisation de CISMeF
5. Discussion
6. Justification
7. Perspectives
Références

Résumé

L'Internet est aujourd'hui devenu une source majeure et incontournable d'informations de santé. Ce projet a pour objectif le Catalogage et l'Indexation des Sites Médicaux Francophones (acronyme : CISMeF) accessibles sur l'Internet. 

CISMeF est un projet initié par le Centre Hospitalier Universitaire de Rouen - Hôpitaux de Rouen. Il a débuté dès l'existence du site Web du CHU en février 1995. Son adresse URL est http://www.chu-rouen.fr/cismef/ ou http://www.cismef.org/. Ce catalogue indexe les principaux sites et documents francophones. Il a dépassé les 12.000 ressources indexées en juin 2003 avec une moyenne de 55 nouvelles ressources par semaine en 2003. 

Cette liste de sites contient un classement thématique, en particulier des spécialités médicales, un classement alphabétique, et un accès par type de ressources. Depuis juin 2000, l'outil associé, Doc'CISMeF, permet d'effectuer des recherches dans le catalogue de ressources, et offre des possibilités de recherche plus étendues. 

CISMeF utilise deux outils standards pour organiser l'information : le thesaurus MeSH (Medical Subject Headings) utilisé notamment pour la base de données bibliographique Medline et le format de métadonnées du Dublin Core. Chaque site indexé comprend une notice descriptive. CISMeF adhère aux principes de qualité de l'information de santé sur l'Internet (Net Scoring), développé en collaboration avec Centrale Santé. CISMeF est un outil utile pour la communauté francophone, professionnel de santé ou cyber-citoyen : chaque jour ouvré, 15.000 ordinateurs se connectent sur ce site représentant environ 20.000 personnes.

 

Prix, partenaires et financements

Dans le cadre de la procédure "Autoroutes de l'Information", CISMeF a obtenu en mars 1998 le label "Expérimentation d'Intérêt Public" par le Comité Interministériel des Autoroutes et Services de l'Information.

Depuis novembre 1998, CISMeF fait partie des actions prioritaires financées par l'Agence Universitaire de la Francophonie (AUF) dans le cadre du programme de l'Université Virtuelle Francophone (UVF). 

Dans le cadre du programme Educnet, Doc'CISMeF a obtenu en juin 2000 un financement par le Ministère de la recherche.

Stéfan Darmoni et Benoit Thirion, coordinateurs du projet CISMeF, ont obtenu, pour ce travail, le titre de Lauréats de l'Académie nationale de médecine par l'attribution du prix Albert Sézary en octobre 2000.

CISMeF a obtenu le prix des jeudis de l'ATICA aux Electrophées 2003, dans la catégorie "Réutilisation des données et XML".

Pour plus de détails, voir les partenaires et les financements de CISMeF.

 

Pour obtenir d'avantage de détails sur l'utilisation de CISMeF et de Doc'CISMeF, nous avons également écrit un guide d'utilisation.

 

Mots-clés (MeSH)

Analyse et indexation [abstracting and indexing] ; catalogage [cataloging] ; France; Internet; MEDLINE ; National Library of Medicine (U.S.) ; descripteur [subject headings] ; subvention gouvernementale non USA [support, non-U.S. gov't]; vocabulaire contrôlé [vocabulary, controlled] ;

 

1. Introduction

L'Internet est devenu aujourd'hui une source majeure et incontournable d'informations scientifiques et médicales [Schatz97]. Pour le professionnel de santé, trouver l'information adéquate sur l'Internet n'est pas une tâche aisée [Thirion98]; d'où la multiplication des annuaires et des outils de recherche [Flannery95]. Mais par expérience, les sites-catalogues généralistes, comme Yahoo France [http://www.yahoo.fr/], Voilà [http://www.voila.fr/] ou encore Lycos [http://www.lycos.fr/] et les moteurs de recherche comme Altavista [http://www.altavista.digital.com/] ou Google  [http://www.google.fr/] ne nous ont jamais permis d’obtenir de manière claire et organisée une présentation de l’information disponible en médecine, limitant ainsi son utilisation potentielle. En neurologie par exemple, un panorama des ressources disponibles n’existe pas. Ces sites-catalogues généralistes et ces moteurs de recherche contiennent pourtant un nombre impressionnant de sites médicaux mais l’organisation et la hiérarchie de leurs données ne sont pas adaptées à la médecine. Nous avons besoin d’une classification spécialisée et hiérarchisée dont la consultation de l’arborescence permet d’" en savoir plus " en s’élevant ou en descendant dans la hiérarchie.

Pour assister le professionnel de santé dans sa quête d’informations électroniques, certains sites tentent de recenser manuellement ou automatiquement les différents sites existants. En effet, l’Internet a engendré un changement de paradigme : il a permis de passer de la problématique de l’accès à l’information à celle du tri dans l’avalanche d’informations.

Il nous paraît  illusoire, sans l’aide d’une classification humaine rigoureuse, d’organiser de façon cohérente des ressources aussi diverses que des associations de patients, journaux électroniques, listes de diffusion, recommandations de bonne pratique clinique, unités INSERM, etc... Une sélection humaine rigoureuse, effectuée par des professionnels de l’information appuyés par des réseaux d’experts, nous paraît être actuellement l’approche la plus raisonnable et la plus efficace pour avoir accès à une partie de la richesse inouïe de ce réseau. Il devient donc urgent, devant l’ampleur de la tâche, de mettre en place des projets coopératifs et de construire des sites fédérateurs d’initiatives visant à sélectionner, décrire et indexer les ressources présentes sur l’Internet. Le catalogage partagé est plus que jamais d’actualité.

Le but de CISMeF est d’assister les professionnels de santé dans leurs quêtes d’informations et de connaissances électroniques disponibles sur l’Internet. CISMeF est un projet initié par le Centre Hospitalo-Universitaire (CHU) de Rouen. Son URL (Universal Resource Locator) est http://www.chu-rouen.fr/cismef/. CISMeF a débuté en février 1995, dès la création du site Web du CHU de Rouen qui fut le premier créé d'un hôpital français (SJ. Darmoni et B. Thirion en sont les deux maitres-toile).

Le cadre de CISMeF est centré sur la santé et les sciences médicales, dépassant la médecine proprement dite. Trois axes prioritaires ont été définis : les ressources concernant l'enseignement, la médecine factuelle (recommandations pour la bonne pratique clinique et conférence de consensus) et les documents spécialement destinés aux patients et au grand public, dans le but de participer à l'amélioration de l'éducation sanitaire dans le monde francophone.

En juin 2003, CISMeF recense 12.291 ressources. Face au nombre croissant de ressources intégrées au catalogue et au besoin de répondre à des requêtes de plus en plus précises, le CHU de Rouen a initié un nouveau projet : la création de Doc'CISMeF en juin 2000. Doc'CISMeF est l'outil qui permet d'effectuer des recherches dans le catalogue de ressources CISMeF, en proposant des possibilités de recherche plus étendues et plus performantes, tout en utilisant la même structure de modèle d'information

En conclusion, la création du " site-catalogue " manuel CISMeF est justifiée par : (a) l'avalanche d'informations potentiellement accessibles, (b) la difficulté de séparer clairement les informations pour les professionnels de celles pour les patients, (c) le manque de spécificité des moteurs de recherche [Darmoni 96] tels qu’Alta Vista quand on les compare aux meilleurs sites-catalogues qui utilisent le thesaurus de Medline pour indexer les sites, et enfin et surtout, (d) la nécessité absolue en médecine de connaître la source et la qualité de l'information. Il est difficile, surtout pour les plus jeunes et les débutants, d'évaluer la qualité des sites.

2. Matériel et méthodes

2.1. Matériel et logiciel

CISMeF a été implanté depuis son origine en février 1995 sur une machine SUN avec Unix comme système d'exploitation. Nous avons changé de machine et de système d'exploitation en octobre 1999. Le serveur http utilisé est aujourd'hui un serveur Apache (serveur HTTP Apache 1.3.6., sous Linux Redhat).
Doc'CISMeF utilise Windoxs 2000 server, avec le serveur d'application HTTP Tomcat 4.0.2. et une base ORACLE 8.1.7.

Nous avons successivement utilisé différents logiciels de statistiques, Getstats version 1.2., NetIntellect, puis enfin Webtrends version 4.5) pour évaluer l'utilisation de ce site après exclusion des requêtes effectuées par les machines du CHU.

2.2. Standards

CISMeF est réalisé en HTML statique. Nous avons originellement utilisé le standard HTML 2.0 pour que ce site soit lisible par la grande majorité des navigateurs. Nous utilisons maintenant le standard plus récent HTML 4.0. Depuis juin 2001, le standard XML est également utilisé, pour permettre une interopérabilité avec d'autres catalogues ou serveurs de ressources (voir un exemple de notice au format HTML et XML). 

Nous utilisons le format RDF (into HTML) pour présenter toutes nos métadonnées.

Ce catalogue utilise également des outils standards pour organiser l'information : plusieurs ensembles d’éléments de métadonnées (données concernant les données) dont l’objectif est d’améliorer la recherche d’information (nous utilisons notamment le format de méta-données du Dublin Core [Panchyshyn], et les métadonnées HIDDEL) ainsi que le thesaurus MeSH (Medical Subject headings) utilisé notamment pour la base de données bibliographique Medline [NLM98a].

3. Réalisation du catalogue

3.1 Le caractère francophone

En novembre 1994, lors de la connexion initiale du CHU de Rouen à l'Internet, nous avons rapidement constaté l'absence de "sites-catalogues" des ressources francophones dans la santé. Il existait en revanche d'excellents "sites-catalogue" anglophones.

CISMeF recense exclusivement les ressources en français de toute provenance. Nous ne cataloguons pas les sites français de langue anglaise. Le nombre de sites et documents catalogués dans CISMeF atteint les 12.300 en juin 2003, avec 55 nouvelles ressources en moyenne par semaine en 2003 ; nous estimons que ce nombre représente environ 10 % de la production mondiale, celle-ci est en grande majorité en anglais.

CISMeF affirme également la présence du français et de la France sur l'Internet. La méthodologie CISMeF comprend 3 étapes : recensement des ressources, filtrage et sélection, description et indexation. Une aide bibliothécaire est en charge du recensement des nouveaux sites, quatre  documentalistes sont chargées de leur description et indexation. Le responsable de la bibliothèque médicale est "super-indexeur", en charge de la vérification de l'indexation. Des réunions fréquentes avec les deux médecins informaticiens permettent l'étude des cas difficiles.

3.2. Le recensement des sites et des documents

Le recensement des sites et des documents est effectué grâce à une veille quotidienne sur les annuaires multidisciplinaires francophones permettant une consultation de leurs nouveautés : Nomade, Toile du Québec, Yahoo, .... En 2003, un total de 2.229 administrateurs de sites (maître-toile), soit 17 % des ressources indexées, nous ont signalé leur existence : la plupart ne répondent aux critères de sélection de CISMeF. Une veille complémentaire est effectuée sur des sites producteurs de documents : ministères, agences gouvernementales, sociétés savantes. Enfin une visite régulière de sites majeurs en médecine et une lecture de la presse médicale et des quotidiens nationaux nous permettent de compléter notre recensement. Sont indexées en priorité les sites des institutions et des sociétés savantes ainsi que la documentation en émanant : recommandations pour bonne pratique clinique, conférences de consensus, matériels d'enseignement, et rapports. Les ressources concernant l'enseignement ainsi que les informations à destination des patients font également partie de nos axes prioritaires.  

La politique éditoriale de CISMeF a progressivement évolué concernant les sites commerciaux : depuis le début de l'année 2000, nous ne les recensons plus. Ainsi, pour connaître les sites commerciaux dans la santé, nous conseillons d'utiliser d'autres outils de recherche. CISMeF ne recense maintenant que les sites institutionnels et documents en émanant. Les sites personnels de patients sont exceptionnellement acceptés.

        3.3. Filtrage et sélection : comment l'information est validée

Dans l'objectif de n'inclure que des ressources de qualité, CISMeF utilise le référentiel des critères de qualité de l'information de santé sur l'Internet (Net Scoring), développé en collaboration avec Centrale Santé,  groupe de travail français fédéré par l'Ecole Centrale de Paris. Ce groupement professionnel est destiné à réunir les ingénieurs intéressés par l'ingénierie des technologies en santé et des professionnels de santé afin d'offrir une plate-forme neutre de réflexion. Le groupe de réflexion sur le Net Scoring a réuni médecins, bibliothécaires médicaux, ingénieurs et juristes. Il a collaboré avec APUI-Santé (laboratoire des technologies de l'information unifiant des réseaux de savoir et de compétences par différents réseaux numériques). 

Le Net Scoring comprend 49 critères regroupés en huit classes principales : crédiblité, contenu, hyper-liens, design, interactivité, aspects quantitatifs, déontologie, et accessibilité. Certains de ces critères sont inspirés d'un livre blanc américain [Ambre97]. Ces critères permettront d’appliquer aux différents sites un ou plusieurs scores tenant compte entre autres des éléments suivants :

Il nous a semblé impératif que le projet CISMeF respecte également ces critères de qualité de l'information de santé. Nous attachons une attention toute particulière au fait que les auteurs doivent être clairement identifiés et les cibles indiquées avec précision. Cela nécessite parfois quelques courriels avec les responsables des sites.

La description d’un site doit également permettre d’évaluer la qualité de l’information fournie. Certains sont refusés, notamment parce qu'ils ne respectent pas certains critères déontologiques. Nous ne recensons pas les sites personnels, sauf s'ils contiennent un contenu informationnel de grande qualité. L’information sur un site n’est valable bien sûr qu’à l’instant " t "   et la qualité du site devra être révisée périodiquement.
Nous nous appuyons également, pour valider certaines ressources, sur un réseau d'experts locaux ou externes à notre institution, constitué au fil du temps et composé de professionnels de santé à même de juger de l'utilité et de la qualité des sites à indexer.

En ce qui concerne le site Web du CHU de Rouen, qui englobe le projet CISMeF, un comité de rédaction a été mis en place en décembre 1996, suite à la volonté des instances de l'établissement de disposer d'une structure de contrôle du développement d'Internet dans le sens d'une évaluation de la qualité et de la cohérence. Ce comité contrôle le fond et la forme (respect de la charte graphique), avec une évaluation externe si nécessaire ; la validité de l'information sur l'Internet doit être systématiquement remise en cause, car, par opposition avec notre existant papier fondé sur les comités de pairs, l'information disponible sur ce réseau n'a pas été évaluée par ceux-ci dans l'extrême majorité des cas. 

3.4 Description et indexation

Le catalogage d’un site se justifie à double titre : connaître à l’avance le type d’information présente (gain de temps) et évaluer son contenu.

Chaque ressource est décrite à l'aide des champs suivants, parmi les 15 du projet Dublin Core : titre, auteur, description, site éditeur, date, identifiant (url), format, langue, mots clés et types de ressources. Sept autres champs sont spécifiques de CISMeF et Doc'CISMeF : institution, ville, département, pays, coût, parrainage, public concerné.

Concernant les ressources pédagogiques, destinées aux étudiants, certains éléments du format IEEE 1484 Learning Object Metadata (LOM) ("cycle" et "année d'études" par exemple) sont ajoutés. Nous utilisons 11 éléments de la catégorie "Educational" de LOM, en attendant la création définitive du DC.Education qui s'inspirera du format LOM. S'il s'agit d'un document répondant à une question d'internat, nous indiquons le numéro de la question concernée (établi selon un classement national).

Pour les ressources de médecine factuelle, CISMeF a défini deux champs spécifiques : "indication du niveau de preuve" et "méthode" pour le déterminer.

Actuellement, nous indiquons dans les métadonnées de nos documents HTML les éléments suivants du Dublin Core :

<meta name="DC.Creator" content="équipe CISMeF ; cismef@chu-rouen.fr">
<meta name="DC.Format" content="(SCHEME=IMT)text/html">
<meta name="DC.Language" content="(SCHEME=RFC1766)fr">
<meta name="DC.Publisher" content="Rouen University Hospital ; Centre hospitalier universitaire de Rouen ">
<meta name="DC.Rights" content="Copyright CHU de Rouen. Toute utilisation partielle ou totale de ce document doit mentionner la source">
<meta name="DC.Subject.Keywords" content="(SCHEME=MeSH)sérologie HIV; AIDS serodiagnosis">
 

Plusieurs sites dans la santé ont adopté le Dublin Core : citons Australian Department of Health and Aged Care [http://www.health.gov.au/], Better Health Channel [http://www.betterhealth.vic.gov.au/], National Health and Medical Research Council [http://www.nhmrc.health.gov.au/], et l’OMS (Organisation Mondiale de la Santé) [http://www.oms.ch/]. 
Pour en savoir plus, voir l'utilisation des métadonnées Dublin Core dans le domaine de la santé et un article en anglais détaillant l'utilisation du Dublin Core dans CISMeF.

Nous avons choisi le thésaurus MeSH, utilisé notamment pour Medline qui est la base de données bibliographiques la plus utilisée au monde. Elle est produite par la bibliothèque nationale américaine de médecine (National Library of Medicine-US). Son thésaurus a l'avantage d'être précis, rigoureux et mis à jour annuellement. Il contient plus de 22.000 termes dans la version 2003 : les MeSH (Medical Subject Headings) . Ces termes sont organisés hiérarchiquement sur 9 niveaux. Nous utilisons également la traduction en français de ces mots clés, réalisée par le réseau DiscDoc de l’Institut National de la Santé et de la Recherche Médicale (INSERM). Dans certains cas qui restent rares, les ressources ne peuvent être parfaitement indexées avec le MeSH ; nous utilisons alors un "mapping" manuel pour rechercher le terme MeSH le plus propre, par exemple les ressources traitant de dysmélie ont été indexées avec le terme MeSH ectromélie.

Avant 2001, notre indexation ne tenait compte que des thèmes traités de manière importante. Ainsi, la pondération existante dans Medline (MeSH Major Topic qui est la possibilité de réduire une recherche aux références les plus pertinentes) n'était pas utilisée, chaque mot clé étant de facto considéré comme majeur dans CISMeF. Depuis 2001, toutes les ressources sont indexées avec des mots clé en majeur ou mineur.

De même les qualificatifs, qui permettent de préciser le sens d'un mot clé, et d'en souligner un aspect particulier, ne sont pas utilisés de façon aussi systématique dans CISMeF que dans Medline. La localisation géographique est mentionnée, lorsqu’elle peut compléter une information, pour une association ou un hôpital par exemple.

Bibliothèque médicale et scientifique de l'IGR [site éditeur IGR Institut Gustave Roussy. Centre européen de lutte contre le cancer ; renseignements pratiques, présentation des collections et des services]. Villejuif-Fr
mots clés : oncologie médicale
type : bibliothèque

L'indexation est susceptible de varier entre les différents indexeurs. Le niveau d'accord dans le choix des termes est appelé consistance. Voici les chiffres pour la consistance de CISMeF (mesurée avec un échantillon de 10 ressources, méthode de Hooper [Hooper65]) :
- La consistance globale est de 30%
- La consistance sur les mot clés MeSH majeurs est de 40%
- La consistance pour les types de ressources est de 55%.

La description d’un site doit aussi permettre d’évaluer la qualité de l’information fournie. Ce point est fondamental en particulier dans le domaine de la santé. Chaque site indexé comprend une "notice descriptive courte" incluse dans les pages des mots clés (pour les ressources indexées au mot clé majeur), ainsi qu'une "notice descriptive longue" (exemple : http://doccismef.chu-rouen.fr/html/nl/09/009780.html).


Le "type de ressource" [Darmoni99] est une généralisation des types de publication de Medline. Nous y avons ajouté des types caractéristiques des ressources présentes sur l'Internet : association, information pour le patient, réseau coordonné, etc... Ce champ "type de ressources" fait l'objet d'un développement particulier à CISMeF, rejoignant en ceci le camp des structuralistes du projet Dublin Core, par opposition aux "minimalistes" qui préconisent un type de ressources par trop réducteur à nos yeux. Nous estimons nécessaire, en effet, de pouvoir distinguer cours, QCM (Questions à Choix Multiples), APP (Apprentissage Par Problèmes), d'une ressource textuelle quelconque.
Le type de ressource ne doit pas être confondu avec le mot clé. Par exemple, une conférence de consensus sur l'hépatite C sera indexée au mot clé hépatite c avec comme type de ressource table ronde consensus. Par contre un article traitant de la méthodologie des conférences de consensus sera indexé au mot clé table ronde consensus avec article de périodique comme type de ressource. Certains termes sont tantôt un mot-clé décrivant le sujet (exemple département anesthésie hôpital), tantôt un type de ressources, utilisé comme répertoire (exemple répertoire des départements hospitaliers d'anesthésie). 

Enfin, depuis 2002, pour qualifier la qualité de l'information, nous utilisons le langage HIDDEL dans le cadre du projet européen MedCIRCLE (http://www.medcircle.org/). Les 270 principaux sites éditeurs qui produisent des documents de qualité seront évalués (120 le sont déjà). Le but de ce projet est l'interopérabilité entre les institutions participantes, basée sur un échange de fichiers au format RDF (Resource Description Framework). Un logo MedCIRCLE sera attaché à chacune des notices CISMeF correspondant à ces sites éditeurs : CISMeF devient donc un tiers de confiance explicite.

 

3.5. Structure du catalogue, classification

CISMeF contient un classement thématique, incluant les principales spécialités biologiques et médicales reconnues en France, un classement alphabétique, tous deux inspirés du thésaurus de Medline et un accès par type de ressources.

Méta-terme
Les méta-termes correspondent à des spécialités biologiques ou médicales concernées par un ou plusieurs mots clés (ou arborescences de mots clés), qualificatifs, ou types de ressources [Thirion 99]. Par exemple pour le terme cancérologie, on trouve d'abord les sites généraux consacrés à la spécialité puis les arborescences, mots clés et qualificatifs du thesaurus MeSH concernant cette spécialité : antinéoplasiques (arb), marqueur biologique tumeur (arb), oncologie médicale (arb), secondaire (qualificatif), service oncologie hôpital (MeSH), service oncologie hôpital (type de ressource), tumeurs (arb). D'autres termes bénéficient également de cette structure, lorsque leur thématique le justifie, exemple enseignement et éducation.

A l'intérieur de ces arborescences, chaque mot clé correspond à une page, par exemple, infection hospitalière. Chaque page est organisée à l'aide des qualificatifs hiérarchisés puis, au sein de ceux-ci, à l'aide des types de ressources.

CISMeF est donc structuré en 4 niveaux hiérarchiques :

méta-terme

mot-clé

qualificatif

type de ressources


Le classement alphabétique utilise les termes MeSH en français de la traduction effectuée par l’INSERM, et indique également les termes américains (indiqués entre crochets), ce qui permet une recherche bilingue. A ce jour, nous avons indexé des ressources correspondant à 10 627 mot-clés, soit environ 48% du thesaurus MeSH (version 2004). Nous entreprenons progressivement la traduction des définitions ("scope note") du thesaurus.
L'utilisation du MeSH en français de l'INSERM nous permet de maintenir une cohérence quant au choix des termes retenus. La consultation de l’arborescence du thesaurus américain en ligne [http://www.nlm.nih.gov/mesh/MBrowser.html] nous permet de déterminer si le mot clé appartient à une ou plusieurs catégories. Ainsi le mot clé "alcoolisme" doit-il être répertorié à la fois dans les arborescences "troubles liés environnement" et "troubles mentaux". Dans CISMeF, nous développons les arborescences dans l'ordre alphabétique français, avec les accents. Il est, en effet, indispensable de pouvoir naviguer dans les arborescences afin d'élargir ou au contraire affiner une recherche par mots clés. Une navigation "dynamique" est possible en cliquant sur l'icône et permet de visualiser en un seul clic l'ensemble des

arborescences auxquelles le mot-clé appartient.

Cette organisation des données est assez délicate à manipuler, mais offre l’avantage d’allier logique et cohérence. Elle permet en effet d'établir trois classements proches de ceux du MeSH : arborescence (tree) [ par exemple, maladies virales ], alphabétique et permuté. Ce dernier est consultable par le moteur. 

Enfin, il est aussi possible d'accéder directement aux types de ressources, lorsque celles-ci font l'objet d'un répertoire particulier, exemple faculté de médecine.

Dans la terminologie CISMeF, outre les mots clés et les qualificatifs qui décrivent le sujet de la ressource, les types de ressources concernent la nature des informations véhiculées. Ce concept s'applique à la ressource dans sa globalité et il est impossible, jusqu'à présent, d'appliquer un type de ressource à une partie de document. Il n'est pas possible d'utiliser les types de ressources pour spécifier un aspect particulier d'un mot clé ou d'un couple mot clé / qualificatif.

L'objectif est de pouvoir faire une recherche plus précise permettant de trouver, par exemple, des images d'une pathologie particulière. Jusqu'à présent, la pathologie était représentée par une indexation par mots clés, et le type de la ressource concernait la ressource dans sa globalité, en ne tenant pas compte de la présence du type d'images dans le document. Le but est donc d'obtenir davantage de précision lors de l'indexation et de la recherche d'information, en permettant la recherche d'images par leur contenu.

Cette idée nous a été apportée par l'existence d'un troisième sujet de thèse (de Filip Florea) qui a débuté en novembre 2003 dans l'équipe CISMeF, concernant l'indexation bimodale texte-image.

91 types de ressources correspondant à des images médicales ont d'abord été créés. Cette liste est en partie dérivée de l'arborescence du mot clé MeSH diagnostic par imagerie, et elle a été revue et mise à jour par un expert en imagerie médicale (le Pr Jean-François Dacher). L'utilisation de cette nouvelle liste de types de ressources pour l'indexation de documents médicaux contenant des images, permet de rendre le processus d'indexation plus précis. Ainsi, par exemple, une ressource pédagogique concernant la lithiase cholédocienne et contenant des images échographiques de cette pathologie sera indexée avec le mot clé lithiase cholédocienne et les types de ressources échographie et matériel enseignement. Et, si elle contient un paragraphe décrivant l'échographie de la lithiase cholédocienne, la ressource sera indexée avec le mot clé lithiase cholédocienne auquel le qualificatif échographie sera affilié (soit le couple lithiase cholédocienne / échographie) ainsi que le type de ressource matériel enseignement.

La lacune de ce système est que les types de ressources se trouvent toujours être "flottants", c'est-à-dire qu'ils concernent l'ensemble des mots clés choisis pour l'indexation d'une ressource, un même document pouvant concerner plusieurs pathologies différentes, et donc être indexé avec des mots clés très divers. Par exemple, un cours est indexé aux mots clés cardiomyopathie hypertrophique, cardiopathie congestive et cardiomyopathie restrictive et aux types de ressource radiographie et matériel enseignement. Le type de ressource radiographie a été choisi parce que la ressource contient une image concernant la cardiopathie hypertrophique. Lors d'une recherche, un utilisateur peut vouloir trouver une ressource présentant une radiographie de la cardiopathie congestive et formuler la requête booléenne suivante : "cardiopathie congestive.mc AND radiographie.tr" qui renverra notre ressource précédemment décrite alors que l'image contenue concerne la cardiopathie hypertrophique.

Pour affiner la procédure d'indexation et de recherche d'information, l'idéal est de pouvoir associer un type de ressource à un mot clé ou à un couple mot clé / qualificatif, pour ainsi composer un triplet mot clé / qualificatif \ type de ressource. Ainsi, une ressource contenant des images radiographiques de la cardiopathie congestive sera indexée avec le couple cardiopathie congestive / diagnostic. Si l'image permet le diagnostic de la cardiopathie congestive, la ressource sera indexée avec le triplet cardiopathie congestive / diagnostic \ radiographie. Seul un nombre de types de ressource spécifiques peuvent être affiliés à un mot clé ou un couple mot clé / qualificatif.

Cette extension du couple mot clé / qualificatif au triplet mot clé / qualificatif \ type de ressource améliore le processus de recherche d'information. La requête de forme "(mot clé / qualificatif) AND type de ressource" est moins pertinente qu'une requête de forme "mot clé / qualificatif \ type de ressource".

Il faut, malgré tout, pouvoir traiter l'ambiguïté de certaines requêtes. Ainsi, un utilisateur formule, en langage naturel (par le formulaire de recherche simple de Doc'CISMeF), une requête de la façon suivante : diagnostic de la lithiase cholédocienne par échographie. Il est impossible à ce stade de savoir si l'utilisateur souhaite un texte expliquant l'échographie dans le but du diagnostic de la lithiase cholédocienne, ou une image échographique permettant le diagnostic de la lithiase cholédocienne. Dans le doute, pour l'instant, les résultats proposés englobent pour l'instant une union des deux, à savoir les textes explicatifs sur la technique d'imagerie ainsi que les images elles-mêmes.

4. Résultats

CISMeF est efficace pour retrouver des ressources francophones de qualité dans la santé. Sur un échantillon représentatif de 600 ressources (sites et documents), 70%  proviennent de France, 16 % du Canada, et en particulier du Québec, 4% de Suisse et de Belgique, et 3% d'Afrique.

Ce site Web est principalement et initialement dévolu au professionnel de santé, bien que le grand-public puisse y accéder. Beaucoup de ressources intéressent les deux publics. Toutes les pages de CISMeF sont en libre accès et gratuites. Ainsi, nos "utilisateurs" sont non seulement des professionnels de santé, mais aussi des patients, leurs familles et le grand public [Thirion99]. Nous jugeons qu'une formation à CISMeF devient indispensable pour utiliser toutes ses fonctionnalités, notamment son modèle de structuration de l'information à 4 niveaux. Deux sessions de formation ont été effectuées en février 1999 pour une association de patients (URAPEI).

CISMeF a trois axes principaux : (a) la médecine factuelle, (b) l'enseignement, et (c) l'information aux patients. Nous recensons également :

  1. hôpitaux, centre de soins et cliniques,

  2. institutions,

  3. affaires sociales,

  4. bibliothèques médicales,

  5. journaux électroniques, 

  6. bases de données et bibliographies,

  7. éditeurs médicaux,

  8. associations (de professionnels et de patients).

Depuis février 1995, plusieurs nouvelles fonctionnalités ont été ajoutées pour faciliter la recherche d'informations : une rubrique "Quoi de neuf" pour visualiser rapidement les nouveautés sur le site, en particulier les nouveaux sites référencés, et un outil de recherche Doc'CISMeF. Un guide d'utilisation est disponible en ligne. CISMeF est accessible par le dénominateur le plus commun de la technologie Internet.

4.1. Statistiques d'utilisation de CISMeF

Un des rôles fondamentaux du maître-toile est de mesurer avec précision le site dont il est responsable, en choisissant des critères reproductibles. Nous en avons identifié deux principaux dans le Net Scoring : par unité de temps, il faut mesurer le nombre de pages HTML lues et le nombre de machines, en excluant les machines du site. Mais d’autres critères doivent être étudiés, selon la structuration du site. Par exemple, pour les sites dynamiques, le critère "Nombre de pages HTML lues" doit être remplacé par le critère "Nombre de requêtes".

Le nombre de machines qui visitent le site par unité de temps est un critère utilisé pour tenter de mesurer le nombre de personnes qui consultent le site. Étant donné qu'il est difficile (y compris sur le plan éthique) de récupérer le courriel de la personne visitant le site, on utilise plus communément l'adresse IP des machines. Ce critère a le mérite d'être plus anonyme que le précédent. Si deux personnes utilisent la même machine, ce critère ne mesure qu’une seule machine. Du fait de la prolifération des machines "proxy", il existe une sous-estimation du nombre de personnes utilisant le site, autrement dit une sous-estimation du trafic engendré par la consultation du site, mais elle est la même pour tous les sites. Ainsi, pour tous les centres hospitaliers qui possèdent un proxy, la conséquence en termes statistiques est qu’une seule machine est identifiée au lieu de N.

Le second critère retenu est le nombre de documents visualisés dans la même unité de temps. Ce chiffre permet également de quantifier le trafic engendré par la consultation du site. Par "document", on entend "document HTML" ou "document PDF" (Portable Document Format), en éliminant notamment les fichiers image (au format GIF, JPEG, BMP ou d'autres) qui font généralement augmenter de manière exagérée ce nombre de documents. Les Anglo-saxons utilisent le terme non spécifique de "hits" qui incluent tous les fichiers, c’est-à-dire les documents qu’ils soient au format HTML ou PDF ainsi que tous les fichiers image, quel que soit leur format. Néanmoins, en cas de banques d'images, il est important que le maître-toile ait une vision exacte des statistiques sur les fichiers images, car ces images portent en tant que tel une valeur informationnelle.

Pour le site Web du CHU de Rouen, en mars 2000, environ 15.000 machines différentes (après exclusion des machines provenant du CHU) ont visité notre site chaque jour ouvré. Pour tenter d’estimer le nombre de personnes à partir du nombre de machines, nous avons pris comme option (paramétrage du logiciel de statistiques) qu’une machine restant connecté plus d’1/2 heure sur notre site génère une " session " supplémentaire. C’est le nombre de " sessions " qui nous permet d’estimer le nombre de personnes visitant notre site. En mars 2000, le nombre de " sessions " représentant par extrapolation le nombre de personnes se connectant sur notre site, est d’environ 20.000 par jour ouvré. Nous utilisons avec parcimonie le concept de " hits ", qui recouvrent indifféremment tous les fichiers chargés au cours d’une visite de site. Pour en savoir plus, voir ici.

Conformément au Net Scoring, nous utilisons le Web Impact Factor (WIF) qui est le nombre de sites ayant au moins un hyper-lien vers le site du maître-toile [Ingwersen98], pour quantifier indirectement l’impact d’un site. Le WIF du site du CHU de Rouen est de plus de 800 sites, (après exclusion des sites personnels), dont certains sites-catalogue prestigieux [voir http://www.chu-rouen.fr/dsii/html/pointeur.html]. Une autre façon de quantifier l’impact d’un site est d’utiliser un moteur de recherche pour connaître le WIF, non plus en terme de sites, mais en terme de page. Nous utilisons sur Alta-Vista la requête générique suivante qui élimine les hyper-liens internes : +link:nom-de-domaine.code-pays –url:nom-de-domaine.code-pays, soit pour le CHU de Rouen, +link:chu-rouen.fr –url:chu-rouen.fr. Nous définissons ainsi le WIF absolu. Celui du CHU de Rouen est de 7.987. Le WIF relatif est un ratio entre le WIF absolu et le nombre de pages du site étudié présent dans le moteur de recherche. Sa formules est (+link:nom-de-domaine.code-pays –url:nom-de-domaine.code-pays)/+url:nom-de-domaine.code-pays. Le WIF relatif du CHU de Rouen est : 7.987/5.551 soit 1,44.

Alta-Vista indique plus de 2.800 pages qui pointent sur notre site.

Le maître-toile doit effectuer régulièrement une revue de presse, toujours pour mesurer l’impact de son site. Plus de 140 citations sont parues dans la presse au sujet du site rouennais. De plus, nous avons relevé quatre études successives du CESIM (Centre d’Etudes sur le Support de l’Information Médicale) en mars 1998, octobre 1998,  mars 1999 et janvier 2000 qui ont montré que le site Web du CHU est le plus utilisé par les médecins généralistes français, représentant respectivement 10, 17,7 et 11,5% des sites utilisés pour les trois premiers, et en second pour début 2000 avec 2,9%. Le baromètre Sethos-Pharmaceutiques, en février 2003, a permis de constater que le site du CHU de Rouen est le quatrième site le plus consulté par les médecins généralistes (et troisième site institutionnel) avec 20 % d'audience (étude réalisée auprès de 401 médecins généralistes internautes). En revanche, une étude parallèle du CESIM en mars 1999 auprès des médecins spécialistes français plaçait le CHU de Rouen en 11ème position avec 2,4% des suffrages. Il a également été considéré comme le meilleur site français par un sondage du Quotidien du Médecin en 1997. En octobre 2000, l'étude FORMELL sur "l'Apport de l'informatique dans la pratique médicale" réalisée sur un échantillon de 2 462 médecins ayant terminé l'enquête, signale 200 bases de données citées par les médecins. Dans l'ordre : CHU Rouen, Medline, CHU Rennes, Vidal, ANAES, CNOM.
Dernier élément pour mesurer quantitativement un site, nous avons inclus dans le nôtre la liste des publications scientifiques produites par les équipes du site à son propos [voir http://www.chu-rouen.fr/general/pubweb.html].

D'une manière plus générale, les statistiques d'utilisation permettent une gestion affinée d'un site, en connaissant notamment l'origine géographique des visiteurs, et les documents qu'ils visualisent le plus. Sur le site du CHU de Rouen, seulement 34,61% des machines sont en provenance de France (mais 43% des sessions, et 57% des hits), 23,48% des Etats-Unis (ou identifiées comme telles car se terminant par .com, .net, .org, .edu, et .gov), 8,03% du Canada, 3,33% de la Belgique, 2,50% de la Suisse et malheureusement seulement 0,29% en provenance de 14 pays du continent africain ; la localisation géographique des machines connectées à notre site n'a pu être déterminée dans 24,05% des cas (adresse IP sans nom de domaine). Parmi l'ensemble des machines connectées au site Web du CHU de Rouen, nous avons détecté en novembre 1999 10,63 % d’abonnés de Wanadoo, 7,77 % d'AOL, et 3,36 % de Club-Internet ; enfin, 2,3 % des utilisateurs de notre site Web utilisent un modem-câble.

Le maître-toile doit étudier le rapport coût/efficacité des documents présents sur le site. Il doit notamment tenir compte des pages les plus vues, qui doivent être encore plus irréprochables par rapport au Net Scoring. Nous listons dans le tableau 2 les principales pages visualisées de notre site. Le succès de certaines pages peut rester sans explication : ainsi, nous n’en avons trouvé aucune concernant le nombre de visiteurs toujours croissant de la page Bibliothèque du CHU. En revanche, il doit se poser la question de la nécessité de maintenir sur le site des pages très chronophages en terme de gestion, comme par exemple la page WIF, surtout si on la compare à la requête Alta-Vista qui ne nécessite pas de maintenance.

Enfin, le maître-toile doit surveiller quelques éléments plus techniques concernant la place disque voire le trafic engendré sur le réseau interne de sa structure. Ainsi, le site Web du CHU de Rouen contenait ainsi, en mai 1999, 4287 fichiers (2869 HTML, 1159 GIF et 258 JPG) et 62,3 Mo d'espace disque. Le trafic engendré sur le réseau du CHU de Rouen par les différents protocoles de l’Internet, essentiellement smtp et http, ne représentent suivant les jours que 0,3 à 1,5% de la charge réseau (en moyenne quotidienne), ce que nous avons considéré comme négligeable.

Le maître-toile doit également vérifier régulièrement la validité des hyper-liens de son site. Le site du CHU de Rouen contenant 13.605 hyper-liens (dont 3.687 hyper-liens internes), nous lançons tous les trois mois une vérification globale de tous nos hyper-liens avec le logiciel Linkbot Pro 5.

5. Discussion

L'Internet facilite la communication entre professionnels de santé et avec le grand public. Il améliore également l'accès à l'information et à la connaissance pour ces deux publics. Nous distinguons plusieurs types de services pour retrouver l'information de santé sur l'Internet :

OMNI et MedWebPlus utilisent le thésaurus UMLS. OMNI, HON et CliniWeb ont également développé une base de données structurée de leurs ressources (HTML dynamique), ce qui permet de meilleures recherches, notamment pour l'utilisateur expérimenté. Cette fonction a été mise en ligne en juin 2000, avec la création de Doc'CISMeF.

Il est difficile, spécialement pour les étudiants, les patients et le grand-public d'évaluer la qualité de l'information des ressources de santé disponibles sur l'Internet, qui n'ont pas été dans la plupart des cas soumis à un comité de pairs. C'est pourquoi nous avons dévelopé une approche spécifique pour les patients, leur famille et le grand public : CISMeF-patients.

Le principal objectif de CISMeF est de promouvoir les bonnes pratiques médicales et l'enseignement des professionnels de santé et l'éducation sanitaire du grand public, en permettant l'accès aux ressources de qualité dans ces domaines. C'est pourquoi nous recensons en priorité les ressources traitant de médecine factuelle, d'enseignement pour les professionnels de santé et d'information pour les patients et le grand-public. Nous avons récemment proposé que l'indication du niveau de preuve devienne le critère de qualité du contenu médical sur l'Internet, en cas d'information 'sensible' [Darmoni01].

6. Justification

CISMeF permet dès aujourd’hui de démocratiser l'accès des professionnels de santé mais aussi des patients aux inforoutes francophones de la santé. Orienté en priorité pour les professionnels de santé, CISMeF est de plus en plus utilisé par les patients et leurs familles voire le grand-public. De nombreux sites sont dévolus aux deux publics (professionnels de santé d'une part, patient, familles et grand-public d'autre part). Nous avons organisé lors du premier trimestre 1999 nos premières sessions de formation à CISMeF pour les associations de patients (URAPEI).

L'organisation de CISMeF autorise aussi la découverte " par hasard " de sites voisins. Ainsi, lors d’une recherche sur l’hémiplégie, peut-on découvrir l’existence de sites sur la paraplégie (relation de proximité) et, plus généralement, en remontant dans l’arborescence, sur la paralysie (relation de hiérarchie). De même, le renvoi d’orientation " voir aussi " (par exemple " voir aussi les soins palliatifs " sur une page consacrée à la douleur) nous semble très délicat à manier pour un algorithme, même sophistiqué ! Ces renvois sont le fruit d’une réflexion et non d’un calcul statistique. C’est cette même réflexion qui permet de leur donner un sens (une direction). Ainsi la réciprocité n’est pas toujours de mise. S’il est justifié de faire un renvoi de la douleur vers les soins palliatifs et la bioéthique, le renvoi de la bioéthique vers la douleur ne doit pas être systématique.

CISMeF étant aujourd’hui le " site-catalogue " de référence dans la santé francophone, il contribue au développement de l’aire d'éducation, de formation et de recherche, en recensant notamment les sites francophones traitant des ces trois domaines connexes. Par nature, CISMeF participe à la circulation des contenus francophones, en établissant une vigie des sites et documents francophones dans la santé. Ainsi, CISMeF contribue à la valorisation et à l’utilisation du patrimoine francophone dans la santé. CISMeF affirme également la présence du français et de la France sur l'Internet. Ainsi, il permet des échanges d’informations entre les acteurs de la communauté francophone des six continents, grâce à la naissance du septième, le cyber-espace.

Les nouvelles technologies de l'information rendent possible l'accès à la connaissance et le partage des progrès scientifiques à un coût extrêmement faible, ce qui a comme conséquence de désenclaver les pays en développement en les associant à la communauté scientifique internationale francophone.

Ces facilités leur donnent la possibilité de confronter leurs connaissances et de valoriser leurs travaux en les rendant accessibles au plus grand nombre. CISMeF est de plus un outil important de diffusion de la formation continue des professionnels de santé. Au total, CISMeF participe à l’optimisation des pratiques de soin.

Pour des raisons de protection juridique (un certain nombre de sites Web effectuant du "Web-pillage" de notre site), les 2 maîtres-toile (administrateurs du site) du CHU de Rouen, et responsables du projet CISMeF, ont, avec l'accord du Directeur Général du CHU, publié les ouvrages "Annuaire de l'Internet médical francophone" [Darmoni97] et "Internet Médical professionnel" [Cassagne2000]. Une des raisons du succès de notre site pourrait résulter de la synergie entre les deux maîtres-toile qui sont tous les deux des professionnels de l'information (1 médecin informaticien, 1 bibliothécaire) ayant néanmoins une vision différente sur celle-ci [Braude94, Braude95]. 

Dans le cadre de la procédure "Autoroutes de l'Information", CISMeF a obtenu en mars 1998 le label "Expérimentation d'Intérêt Public" par le Comité Interministériel des Autoroutes et Services de l'Information. Depuis novembre 1998, CISMeF fait partie des actions prioritaires financées par l'Agence Universitaire de la Francophonie (AUF) dans le cadre du programme de l'Université Virtuelle Francophone (UVF). Pour les ressources concernant l'enseignement, une collaboration a été instituée avec la commission pédagogique de la Conférence Internationale des Doyens de facultés de Médecine d'Expression Française (CIDMEF) [Denef99]. Dans le cadre du programme Educnet , Doc'CISMeF a obtenu en juin 2000 un financement par le Ministère de la recherche. Stéfan Darmoni et Benoit Thirion, coordinateurs du projet CISMeF, ont obtenu pour ce travail le titre de Lauréats de l'Académie nationale de médecine par l'attribution du prix Albert Sézary en octobre 2000. CISMeF a obtenu le prix des jeudis de l'ATICA aux Electrophées 2003 dans la catégorie "Réutilisation des données et XML".

Voir la liste des partenaires.

7. Perspectives

Nous nous proposons d'enrichir le projet CISMeF en développant quatre nouveaux modules :

  1. l’extension de CISMeF vers les pays du Sud (Tunisie et Burkina-Faso pour l'Afrique et Vietnam pour l'Asie) dans le cadre du programme Université Virtuelle Francophone, financé par l'Agence Universitaire de la Francophonie.

  2. la création d'un outil de recherche interrogeant une base de données de sites de qualité, selon la définition de la médecine factuelle ("evidence-based medicine"). Cette base de données sera interrogeable par mots-clés issus pour la plupart du thésaurus de Medline. La création de cette base permettra d’effectuer des recherches plus sophistiquées pour connaître par exemple :

    1. les conférences de consensus en parasitologie,

    2. les recommandations pour bonne pratique clinique en pathologie tropicale

    3. les instructions aux auteurs des revues de langue française en neurologie.

    Cet outil de recherche a vu le jour en juin 2000 : Doc'CISMeF. Pour en savoir plus, un à propos, et une aide en ligne.
     

  3. la maintenance d'un référentiel de critères de qualité de l'information de santé sur l'Internet : le Net Scoring, en collaboration avec Centrale Santé et APUI-Santé. Une étape supplémentaire serait la "certification" des sites médicaux francophones. Cette grille pourrait constituer un élément constitutif de cette certification, afin d'informer au mieux le "cyber-médecin". Elle peut également aider les acteurs d'Afrique et d'Asie à l'auto-évaluation et la réalisation par les pays du Sud de sites Web conformes aux critères de qualités internationaux.
     

  4. l'accès à CISMeF aux patients et à leurs familles. Un guide d'utilisation a été écrit pour cette catégorie d'utilisateurs néophytes. Nous prévoyons d'aller plus loin en permettant l'accès simplifié à une information de qualité, que CISMeF se doit de fournir aux patients et leurs familles.

CISMeF est un des éléments majeurs du projet plus global Internet/Intranet au CHU de Rouen, qui s'étendra dans les prochaines années, autour de 3 axes :

(a) la diffusion d'informations de santé dans le cadre du développement de l'Université Médicale Virtuelle (UMV) et de la Bibliothèque Electronique de Rouen (Faculté-CHU) avec des prolongements régionaux, nationaux, européens et francophones. Le CHU et la Faculté de médecine de Rouen font partie du consortium de sept facultés de médecine (Grenoble, Lille, Marseille, Nancy, Paris, Rennes, et Rouen) financés par le Ministères de l’Education Nationale, de la Recherche et de la Technologie pour créer une Université Médicale Virtuelle Française (UMVF). [URL : http://www.umvf.pd.fr/].
Nous disposons depuis 1997 de l'accès en Intranet à Medline et à 45 revues biomédicales anglophones prestigieuses en texte intégral [Darmoni98], depuis décembre 1999, à des informations de médecine factuelle (2 revues, ACP Journal Club et Evidence Based Medicine, et les travaux de la collaboration Cochrane) et depuis février 2001 à plus de 400 journaux électroniques de l'éditeur Springer via le consortium COUPERIN. Nous planifions d'étendre la bibliothèque virtuelle en donnant accès à des livres et encyclopédies électroniques (par exemple, le Harrison sur l'Internet). Notre projet d'Université Virtuelle de Rouen s’inscrit dans le projet national d’UMV dont l’objectif est de développer des outils fondés sur les nouvelles technologies pour les étudiants et les enseignants : intégration de la gestion informatique de la connaissance dans le projet pédagogique.

(b) la communication (depuis 1998, tout médecin titulaire qui le souhaite dispose d'une adresse électronique), et
(c) le système d'information hospitalier et de santé, avec éventuellement le Réseau Santé Social comme outil fédérateur (en particulier les réseaux ville-hôpital).

Références

27 septembre 2006
courriel


[Menu général] [CISMeF : menu général] [Guide d'utilisation]

CISMeF
Outil de recherche
Ressources
Index
Terminologie
Aide
A propos de
Avertissement
Equipe
Quoi de neuf
Partenaires
Publications
A propos de
Simple
Avancée
Booléenne
Pas à Pas
Enseignement
Patients
Recommandations
Autres
Doc'UMVF
Doc'UMVF : ECN
Bases de données
Forums et listes de diffusion
Journaux électroniques
Organismes
Tous types
Associations Patients
Bibliothèques médicales
Hôpitaux
Universités et écoles
Index alphabétique
Index auteurs
Index sites éditeurs
Index thématique
Sommaire
Conseils pratiques
Plan du site

 

 

Membres de l'équipe CISMeF
 

[Menu général CISMeF]


 

 

Nom

Fonction

Courriel

 Françoise Charles  Ingénieur d'études, Faculté de médecine de Rouen

 Badisse Dahamna

 Ingénieur de recherche, Equipe CISMeF, CHU de Rouen

Stéfan Darmoni

Coordonnateur du projet CISMeF
Professeur d'informatique médicale, Faculté de médecine de Rouen

Responsable des Technologies de l'Information et de la Communication, Département de Santé Publique, CHU de Rouen

 Filip I. Florea    Doctorant en informatique, Equipe CISMeF, CHU de Rouen 
 & Laboratoire PSI
 Gaétan Kerdelhué  Documentaliste, description et indexation des ressources
 Bibliothèque médicale, CHU de Rouen

Jean-Philippe Leroy

Responsable audit-qualité, Service d'accueil et des urgences, CHU de Rouen

 Catherine Letord  Documentaliste scientifique, Description et indexation des ressources
 Bibliothèque médicale, CHU de Rouen
 Alain Loisel  Doctorant en informatique, Equipe CISMeF, CHU de Rouen 
 & Laboratoire PSI
 Aurélie Névéol  Doctorante en informatique, Equipe CISMeF, CHU de Rouen 
 & Laboratoire   PSI

Suzanne Pereira

Master d'Informatique Médicale, Laboratoire PSI

Josette Piot

Aide-documentaliste, chargée de la veille, description et indexation des ressources
Bibliothèque médicale, CHU de Rouen

Lina Soualmia

Docteur en Informatique, Equipe CISMeF, CHU de Rouen & Laboratoire PSI, ATER INSA de Rouen

Benoit Thirion

Coordonnateur du projet CISMeF
Conservateur des bibliothèques, responsable de la Bibliothèque médicale, CHU de Rouen

 

L'équipe CISMeF est régulièrement renforcée par des étudiants du département Architecture des Systèmes d'Information (ASI) de l'Institut National des Sciences Appliquées (INSA) de Rouen ; citons, dans l'ordre chronologique depuis décembre 1999, Benoit Lacoste, Stéphane Videau, Martial Brisou, Christophe Godard, Isabelle Rigolle, Vianney Gremmel, Gaëlle Loosli, Benjamin Pourchez, Edouard Pichon, Nicolas Schmiel (phonémisation).

L'équipe CISMeF est membre de l'équipe GCSIS, Gestion de la Connaissance et Système d'Information de Santé du laboratoire PSI FRE CNRS 2645.

Contribution à l'élaboration de la nouvelle charte graphique : Chantal MEMPIOT

Visite de collègues Norvégiennes

Le 2 février 2005, CISMeF a fêté ses 10 ans. La Revue du Praticien Médecine Générale s'en est fait l'écho sous la plume de Philippe Eveillard

27 septembre 2006

Doc'CISMeF* est un outil de recherche utilisant le thésaurus MeSH (Medical Subject Headings) en français ou en anglais, permettant l'accès aux sites et documents recensés dans CISMeF.

Quatre types de recherche sont possibles : simple, avancée, booléenne et pas à pas. Dans tous les cas, utiliser les bons termes de recherche améliore considérablement les recherches. Pour trouver ces termes, vous pouvez consulter notre outil de terminologie.

Pour connaître nos nouveautés, voir les sites et documents de la semaine.


L'extension de recherche

 

A droite des résultats, une extension de recherche est proposée avec :
- les mots clés MeSH correspondant aux mots recherchés ou s’en approchant
- des renvois vers les termes voisins
- les concepts associés statistiquement

 

 


Les recherches complémentaires

 

Après une recherche sur Doc'CISMeF vous avez la possibilité de lancer une recherche complémentaire vers des bases de données anglophones.
 

Les bases de données proposées sont :

 

 

 

   

 

Ces recherches complémentaires reposent sur la traduction automatique des descripteurs MeSH. C'est pourquoi il est nécessaire d'effectuer une requête en adéquation avec notre terminologie () pour qu'elles fonctionnent pleinement.

Les liens vers MedlinePlus et NGC sont proposés contextuellement, lorsque la requête porte sur des recommandations ou des documents destinés aux patients.

 

 


* Doc'CISMeF est un clin d'œil à Doc'INSA. "Doc" fait référence à la fois à "document" et "docteur". Les fonctionnalités de Doc'CISMeF ont été largement inspirées par notre expérience de PubMed et d'Ovid dans le domaine médical. Nous sommes redevables au site SGG-FI de l'Université de Göttingen de la structure des pages recherche simple et recherche avancée. 

Doc'CISMeF adhère aux principes de qualité du Net Scoring. Dans le cadre du programme Educnet, Doc'CISMeF a obtenu en juin 2000 un financement du Ministère de la recherche.

Sur le plan technique, Doc'CISMeF repose sur la technologie XML. Les métadonnées sont dissociées de la forme, qui fait l'objet de transformations XSL

Pour en savoir plus : CISMeF : pourquoi, comment , Aide à la recherche : Doc'CISMeF.

courriel 27 septembre 2006

Menu général - CISMeF - Recherche simple ou avancée - Aide 

- © CHU de Rouen -

CISMeF
Outil de recherche
Ressources
Index
Terminologie
Aide
A propos de
Avertissement
Equipe
Quoi de neuf
Partenaires
Publications
A propos de
Simple
Avancée
Booléenne
Pas à Pas
Enseignement
Patients
Recommandations
Autres
Doc'UMVF
Doc'UMVF : ECN
Bases de données
Forums et listes de diffusion
Journaux électroniques
Organismes
Tous types
Associations Patients
Bibliothèques médicales
Hôpitaux
Universités et écoles
Index alphabétique
Index auteurs
Index sites éditeurs
Index thématique
Sommaire
Conseils pratiques
Plan du site

 

 

Ressources francophones en hépato-gastroentérologie

 

Principes généraux

Les ressources francophones ci-dessous donnent accès à des informations médicales de qualité. La liste n'est pas exhaustive mais ces sites constituent un bon point de départ (voir également le chapitre consacré aux Sociétés savantes et institutions). En l'absence de référence, consultez également les ressources en anglais ainsi que les revues en ligne.

 

 

CISMeF

L'annuaire de sites médicaux du CHU de Rouen est une des références de l'Internet santé en français. Plusieurs méthodes d'interrogation à utiliser en foncton des besoins : moteur (ci-dessous), choix d'un mot-clé, choix d'un thème.


 

1/ choix par mot clé : ici http://www.chu-rouen.fr/ssf/santpath.html

recherche par thème : ici  http://www.chu-rouen.fr/ssf/santspe.html

 

Comment faire une recherche documentaire en médecine générale? La question est vaste et complexe, aucune réponse standardisée n'est possible, tant les ressources du web sont immenses. Ce document n'a donc rien d'une référence, il vous donnera une seule réponse, non pas générale, mais particulière, très particulière: vous saurez comment l'auteur de ce document, faisait une recherche au mois de Juillet 2001. Cela ne veut dire:

Disons simplement que je vous invite à une promenade sur le web en ma compagnie, si vous voulez bien l'accepter.

quelle est la nature de la recherche?

Un médecin généraliste, comme son nom l'indique, a un champ d'intérêt immense, non borné, en médecine. Les questions qu'il se pose peuvent être de natures très variables. Ce serait une erreur que de penser que la réponse est toujours sur MEDLINE: la plupart du temps, une requête MEDLINE livre un nombre de documents à la fois beaucoup trop élevé, et beaucoup trop pointu, donc inadapté à nos besoins. Nous avons souvent besoin d'informations déjà structurées, déjà pensées par un autre médecin. Il nous faut donc structurer les sites, et les interroger pour ce qu'ils peuvent nous apporter.

Partons donc ensemble en ballade. Monsieur H a 62 ans. Lors d'une radiographie suite à une frature de Pouteau-Colles, vous êtes frappé par la déminéralisation. Une pluie de questions envahit votre cerveau:

On voit bien, à la lumière de ces questions, combien elles sont variées, et de niveau scientifique distinct. Certaines sont des questions d'enseignement médical général, comme "l'ostéoporose existe-t-elle chez l'homme et à quoi est-elle due?" dont on imagine que la réponse pourrait se trouver dans un bon livre de rhumatologie, d'autres sont des questions de médecine générale ("quel bilan étiologique effectuer en débrouillage?"), d'autres enfin doivent faire effectuer une recherche soigneuse car le domaine de recherche est en constant remaniement ("quel traitement proposer?"). C'est pourquoi nous avons classé les dix démarches de recherche que nous vous proposons sous deux chapeaux distincts: "rechercher un document de synthèse", et "rechercher un document 'pointu'"

Tous les sites que nous allons utiliser sont présents sur la page "sites" du site sftg paris-nord: http://www.paris-nord-sftg.com/a.sites.fmc.php3

A. LA RECHERCHE DE DOCUMENTS DE SYNTHESE

Le plus simple, en général, est de commencer par la recherche de documents de synthèse. Ils contiennent en général une bonne partie de l'information nécessaire, et sous une forme agréable à utiliser.

Première démarche: aller sur le site sftg paris-nord

A tout seigneur tout honneur: visitons d'abord le site sftg paris-nord. Outre qu'il s'agit du site de mon association de formation continue, ce qui lui donne une tonalité particulière, c'est un site bien conçu de médecine générale, contenant à la fois de l'information pointue, et de l'information synthétisée. Deux possibilités de recherche:

1.utiliser le moteur de recherche de sftg paris nord

on trouve ce moteur de recherche sous le lien "rechercher" du tableau jaune présent au début et à la fin de toutes les pages du site. La recherche se fait en langage naturel. Si vous composez "ostéoporose", vous trouverez toutes les pages qui contiennent le mot "ostéoporose" (il y en a 12 aujourdh'ui, le 7/7/2001), et si vous écrivez "ostoporose homme", vous trouverez toutes les pages qui contiennent à la fois les deux mots (deux documents). Cette deuxième recherche n'est pas pertinente: les deux documents proposés ne correspondent pas à votre recherche. Par contre la première recherche vous donne un document qui commence par "cr": cela indique qu'il s'agit d'un compte-rendu de réunion. C'est probablement un excellent document de synthèse: cr.ostoporose.sftg.paris.nord . Vous y trouverez sans doute des réponses à certaines des questions posées ("qu'est-ce que l'ostéoporose, comment la diagnostiquer, etc..). L'inconvénient du système "moteur de recherche sftg paris-nord" est que vous ne trouverez vos documents que si les mots-clés que vous utilisez y sont effectivement présents. Imaginez que vous cherchez un document contenant "hypertension artérielle", vous raterez probablement les documents qui ne contiennent à sa place que le mot "HTA". Pour éviter cet inconvénient, sftg paris-nord indexe ses documents à l'aide du MeSH. Mais nous en reparlerons plus loin.

A noter qu'il arrive que le moteur de recherche de SFTG Paris-Nord vous propose aussi des documents pour la consultation (http://www.paris-nord-sftg.com/a.cat.doc.patients.php3). Il n'y en a pas sur le thème de l'ostéoporose, au jour où ces lignes sont écrites, mais une cinquantaine de thèmes sont couverts, et très utiles à distribuer aux patients (voir par exemple sur l'adénome prostatique: http://www.paris-nord-sftg.com/patients.adenome.prostatique.0101.htm)

2. utiliser la rubrique "classement par spécialités"

Vous la trouverez aussi dans le tableau jaune du début et de la fin de chaque page du site. Vous cliquerez ensuite sur "rhumatologie". Avantage: vous trouverez nécessairement sous cet onglet TOUS les documents de rhumatologie du site sftg paris-nord. Inconvénient: ils sont classés par date et non par sujet. Mais il est assez facile de les survoler rapidement.

Deuxième démarche: cherche sur "google"

Google (http://www.google.fr/)est un moteur de recherche généraliste. Habituellement ce type de moteur (voir yahoo, altavista) est inutilisable pour le sujet qui nous occupe: les réponses obtenues sont trop nombreuses et disparates. Mais Google a le don de vous proposer des réponses pertinentes, surtout parmi les premiers choix proposés. En effet les pages sont rangées dans un ordre particulier, celui du nombre du liens qui pointent vers un page donnée. Les pages les plus "populaires" (et donc souvent les plus pertinentes) sont donc en premier. Faites l'essai. Personnellement j'ai obtenu 8070 réponses avec "ostéoporose homme" sur les sites francophones. C'est beaucoup trop. Mais sur la première page des réponses, j'ai trouvé trois pages qui me paraissent pertinentes, comme documents de synthèse du problème: l'une vient de la société de l'ostéoporose du canada, http://www.osteoporosis.ca/FR_OSTEO/D01-01.html , la seconde est sur caducée. net: http://www.caducee.net/DossierSpecialises/rhumatologie/osteoporose.asp , la troisième est sur le site de la faculté de médecine de Saint Etienne: http://www.univ-st-etienne.fr/facmed/finit/mhlafag/p2lafage/fisiopat.htm

Troisième démarche: chercher un consensus (http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre158706)

Nous avons assez bricolé, il faut maintenant devenir un peu professionnels. A ce stade, la recherche d'un consensus existant est souvent utile: les documents de consensus sont en général de très bonne qualité, il reposent sur une abondante bibliographie, en général à jour au moment de la publication du document. De plus ils sont souvent structurés pour répondre à des questions pratiques de la pratique médicale courante. vous trouverez une liste de sites de consensus à: http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre158706

La recherche d'un consensus francophone passe à mon avis par le site de la Bibliothèque A.F. Lemanissier, qui tient en principe à jour tous les consensus français, et un certain nombre de consensus francophones. Allez sur: http://www.bmlweb.org/consensus.html .Choisissez la spécialité de rhumatologie, cliquez. Parcourez les références proposées. Une seule concerne l'ostéoporose, c'est un document de l'INSERM, http://dicdoc.kb.inserm.fr:2010/basisrapports/osteo.html. Il apporte des informations sur la prévention et le traitement.

Une autre recherche de consensus francophone peut être faite parmi les consensus canadiens, en allant sur le site des guides de pratique clinique de l'infobanque AMC : http://www.cma.ca/cpgs-f/index.asp. En composant "ostéoporose" dans le moteur de recherche de l'infobanque, j'ai obtenu 12 références, toutes consacrées à l'ostéoporose post ménopausique: cela ne correspond pas à notre question.

Passons maintenant aux consensus anglophones, puisque nous sommes déçus des consensus francophones. Je vous propose d'abord les abstracts des Cochranes Reviews. Ces groupes de travail britanniques maintenant très anciens proposent des documents de consensus de très bonne qualité, dont malheureusement seuls certains abstracts sont disponibles sur le net. Vous les trouverez à : http://www.cochrane.org/cochrane/revabstr/mainindex.htm. Comme vous le voyez, il n'y a pas de moteur de recherche, il faut parcourir les thèmes. Le thème "Cochrane Musculoskeletal Group" paraît intéressant. En cliquant sur ce lien, j'ai trouvé quatre références intéressantes sur le traitement de l'ostéoporose, par les biphosphonates (http://www.cochrane.org/cochrane/revabstr/ab001347.htm), la calcitonine(http://www.cochrane.org/cochrane/revabstr/ab001983.htm), le calcium vit D(http://www.cochrane.org/cochrane/revabstr/ab000952.htm) et le fluor (http://www.cochrane.org/cochrane/revabstr/ab002825.htm). Ces articles sont malheureusement un peu courts: ce sont des abstracts.

Un autre bon site de consensus américains est le NGC National Guideline Clearinghouse™. Personnellement, j'ai tenté aujourd'hui d'y aller pour la présente recherche: dommage, le site ne marche pas. Vous aurez peut-être plus de chance le jour où vous lirez ce document.

Quatrième démarche: chercher sur les sites des facultés de médecine (http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre174528)

De nombreuses facultés proposent leurs cours en ligne. Cela permet de trouver des documents d'une qualité relativement bonne, qui n'ont bien sûr pas le niveau de preuve d'une conférence de consensus, mais permettent quand même de faire un point général sur un sujet. Personnellement j'utilise certaines de celles qui sont regroupées à: http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre174528.

En passant par exemple par le corpus médical de la faculté de médecine de Grenoble (http://www-sante.ujf-grenoble.fr/sante/), j'ai trouvé dans le classement par disciplines, sous le lien rhumatologie, l'article suivant: http://www-sante.ujf-grenoble.fr/sante/corpmed/Corpus/corpus/question/rhum097/rhum097.htm, qui contient certaines réponses aux questions que nous nous posions, en particulier en matière de bilan.

De même, sur le site de l'université de Lyon I (http://cri-cirs-wnts.univ-lyon1.fr/Polycopies/) on trouve un autre excellent document, assez analogue: http://cri-cirs-wnts.univ-lyon1.fr/Polycopies/Rhumatologie/Rhumatologie-18.html

Cinquième démarche: chercher sur les sites spécialisés (http://www.paris-nord-sftg.com/a.sites.par.spec.php3)

Il existe presque toujours, lorsqu'on fait une recherche documentaire, des sites spécialisés dans le domaine correspondant. Sur le site SFTG Paris-Nord, vous trouverez des sites classés par spécialité à: http://www.paris-nord-sftg.com/a.sites.par.spec.php3. Mais la meilleure banque de sites, à mon sens, est le CISMEF du CHU de Rouen (http://www.chu-rouen.fr/cismef/).

En cherchant dans l'index alphabétique du CISMEF, sous l'onglet "ostéoporose", on tombe sur la page: http://www.chu-rouen.fr/ssf/pathol/osteoporose.html , qui nous donne quelques adresses pertinentes, en particulier une association de patients québecois, mine d'information pour votre patient (http://www.osteoporose.qc.ca/). Vous noterez que nous avons déjà visité certains liens de cette page, signe que notre recherche a été pertinente, avant même d'arriver sur le CISMEF.

Il existe d'autres banques de sites médicaux. SFTG Paris-Nord vous en propose une liste. A noter un site un peu fouillis, mais bien achalandé, generique.net : http://www.generique.net/pages/

Sixième démarche: chercher parmi les maladies rares (http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre166084)

Imaginons maintenant que votre patient présente en plus un problème ophtalmologique, mettons une opacité cornéenne unilatérale. Il vous dit que dans son enfance, on lui a parlé d'un syndrôme rare dont il était atteint, le syndrôme de WINCHESTER. Lorsque l'affection que l'on cherche est un peu tordue, rare, un site s'impose: ORPHANET (http://orphanet.infobiogen.fr/Site/Page.stm?Lng=FR&Lvl=Pro). En tapant "WINCHESTER" dans le moteur de recherche d'ORPHANET, vous saurez un certain nombre de choses sur la maladie: au moins ses signes principaux, mais aussi le diagnostic biologique (s'il existe), des bases de thérapeutique, les adresses des sites de patients, etc... Une mine inépuisable et indispensable. Vous découvrez au passage que l'ostéoporose est un des éléments du syndrôme de Winchester, et vous en concevez une satisfaction émue.

Si orphanet ne vous a pas suffi, allez donc voir son grand frère anglophone: NORD (http://www.rarediseases.org/)

Septième démarche: chercher dans quelques revues francophones non indexées (http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre149794).

Vous avez forcément quelques revues fétiches, que vous aimez particulièrement. Peut-être ont elles publié un dossier sur le sujet qui vous intéresse. Personnellement, j'aime beaucoup "Médecine et Hygiène", dont la totalité du contenu est en ligne, "Larevue du Praticien", et "La Revue du Praticien-Médecine Générale", dont seulement quelques articles sont en ligne. Aucune de ces deux revues n'est indexée sur MEDLINE, il faut donc aller chercher "à la main" dans leur contenu.

Vous trouverez les adresses de certaines revues à http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre149794. Choisissons-y Médecine et Hygiène.(http://www.medhyg.ch/). La revue nous propose, dans sa zone "formation", un moteur de recherche (http://138.190.133.26/mh/formation/search.php3). J'y ai composé "ostéoporose homme": aucun résultat. Par contre la clé "ostéoporose" donne 26 résultats, dont un certain nombre d'articles passionnants.

Pour chercher sur La Revue du Praticien-Médecine Générale, il faut au préalable s'être inscrit sur le site, dont l'accès est réservé aux membres du corps médical. C'est gratuit. Faites-le sur 33docpro: http://www.33docpro.com/. Lorsque ce sera fait, cliquez sur l'item "fonds documentaire" de la page d'accueil. Vous verrez que la recherche se fait par initiale du mot-clé. En cherchant sous l'onglet "O" comme "ostéoporose", vous trouverez un certain nombre d'articles parus dans la revue du Praticien et la Revue du Praticien Médecine Générale. L'un des articles correspond étrangement à notre sujet, puisque son titre est: "ostéoporose: chez l'homme aussi".

Huitième démarche: chercher sur une base de données francophone spécialisée.(http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre161191)

Certaines disciplines se dont dotées de bases de données francophones spécialisées (la santé publique, la toxicologie, etc...). Peut-être que les passionés du sujet sur lequel nous cherchons l'ont fait. Allons voir la liste de ces bases de données sur:http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre161191. Manifestement la liste proposée ne contient rien qui soit en rapport avec l'ostéoporose. Dommage.

B. RECHERCHER DES DOCUMENTS "POINTUS"

Neuvième démarche: définir les mot-clés d'une recherche plus poussée. Le MeSH (http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre154296)

 

Nous voici arrivés à un stade assez avancé. Si nous voulons aller plus loin, il nous faut maitenant chercher dans les moteurs anglophones des grandes bases de données internationales. Jusqu'à présent, nous ne nous sommes pas trop préoccupés des mots-clés à utiliser. Nous avons considéré que "ostéoporose" allait bien.
 
Pour faire une recherche documentaire de qualité, on ne peut pas se contenter de ce qu'on appelle le langage naturel. Il faut être sûr que les mots qu'on utilise pour une recherche sont bien ceux qui permettent d'indexer les articles. Sinon, la recherche est invalide. Cet argument vaut pour la recherche francophone, comme pour l'anglophone, et nous aurions pu commencer cet article par ce paragraphe, cela aurait été plus rigoureux.
 
L'index général des mot-clés de la recherche bibliographique en médecine existe: il s'appelle le Medical Subjects Headings, ou MeSH. C'est une langue hiérarchisée, assez logique et facile à apprendre. Ce vaste index est originalement écrit en anglais, mais il a été traduit en français.
 
Le bon bibliographiste doit prendre la peine de comprendre la logique du MeSH, mais cela prend du temps. Un jour où vous aurez ce temps, allez donc sur le site de l'URFIST, où vous trouverez un document très clair, qui vous en explique toutes les arcanes: http://www.ccr.jussieu.fr/urfist/biolo/bioguide2/medline/medline.htm
 
Aujourd'hui, vous n'avez pas le temps de parcourir l'URFIST. Nous allons donc nous lancer dans une recherche pragmatique. Supposons qu'au terme de la lecture des articles trouvés ci-dessus, la seule question à laquelle vous n'ayez pas répondu soit celle du traitement de l'ostéoporose masculine, et plus précisément de la place des biphosphonates dans ce traitement. Ce sont ces mot-clés que nous allons chercher à définir.
 
Le plus simple est de chercher les mot-clés en français. Allons sur le site de HON sélect, http://www.hon.ch/HONselect/Search_f.html, et composons "ostéoporose" sur le moteur de recherche MeSH en français: tout va bien. "Osteoporose" est un mot-clé MeSH (à condition de ne pas avoir d'accent). C'est une Maladie. Une sous-catégorie de cette maladie, dans la hiérarchie MeSH, est "osteoporose post-ménopausique". Si, sur la page de résultats, vous cliquez sur l'un de ces deux items, vous tomberez sur leur définition, et en descendant dans la page (divine surprise) sur une proposition de recherche bibliographique déjà prête!! On trouve même des images sur le sujet... Une vraie mine!!
 
De la même façon, cherchons "biphoshonates" sur HON sélect: le résultat est que "biphosphonates" n'est pas un terme MeSH. Si vous aviez composé ce terme sur un autre moteur de termes MeSH, celui qui propose l'INSERM par exemple (http://dicdoc.kb.inserm.fr:2010/basismesh/frm_mesh2000.html), vous seriez bredouille, ayant seulement l'information que "biphosphonates" n'est pas un terme MeSH... Mais HON sélect fait plus que l'INSERM, il vous propose en plus le BON mot-clé: c'est "diphosphonates". De même, HON Sélect va vous en proposer la définition, et une recherche bibliographique prémâchée...
 
Le troisième item "homme" pose plus de problème. Cherchez cet item sur HON sélect, votre résultat sera décevant. Vous pouvez aussi chercher "mâle", le résultat n'est pas conforme à vos attentes. Pourquoi? Probablement parce que "male" appartient à la catégorie des "check tags" (ou descripteurs obligatoires) (dont voici la liste complète en anglais:ANIMAL; CASE REPORT; COMPARATIVE STUDY; ENGLISH ABSTRACT; FEMALE HUMAN ; IN VITRO ; MALE , PREGNANCY ; SUPPORT, NON-U.S. GOV'T ; SUPPORT, U.S. GOV'T, NON-P.H.S.; SUPPORT, U.S. GOV'T, P.H.S. ). Les "check tags" sont des descripteurs que chaque auteur doit OBLIGATOIREMENT associer à son article, il n'a pas le choix. Où sont identifiés les check tags sur HONsélect? Ma foi, je n'en sais rien...
 
Nous avons trouvé nos mot-clés en français. Mais une recherche de bonne qualité ne s'effectue, à dire vrai, qu'en anglais (de toutes façons même les articles français sont indexés en anglais sur les bases de données internationales). Traduisons donc nos mots en anglais. Rien de plus facile: retournons à la page de résultat de recherche pour "ostéoporose": http://www.hon.ch/cgi-bin/HONselect_f?browse+C05.116.198.579: nous notons que, dans le bandeau supérieur bleu de la page, on trouve des petits drapeaux. Cliquons sur le drapeau anglo américain: nous voici sur la page anglaise correspondante: http://www.hon.ch/cgi-bin/HONselect?browse+C05.116.198.579. Nous savons dès lors que le terme MeSH pour ostéoporose est en anglais "osteoporosis". Faisons de même pour "diphosphonates": le terme est identique en anglais.
 
Dixième démarche: chercher dans les grandes banques de données internationales (http://www.paris-nord-sftg.com/a.sites.fmc.php3#ancre151917)

 

 

 

Bien chercher une information médicale sur Internet

"Quand on ne trouve pas une information médicale sur le Net, c'est souvent qu'on a mal cherché".


 

Cette page présente quelques recettes pour être plus efficace dans la recherche d'information. Les onglets ci-dessus permettent d'interroger directement les principaux sites en hépato-gastroentérologie.


 

Comment chercher sur Internet

La première manière de progresser est de lire d'excellents documents facilement accessibles:

Connaître quelques concepts simples

Moteurs ou annuaires

Un moteur de recherche est un robot qui explore sans fin la Toile pour indexer son contenu. La qualité des pages ne peut être évaluée puisqu'il s'agit d'un programme sans intervention humaine. Sa force est liée aux nombre de documents indexés.
Un annuaire est une liste de sites référencés par un(e) documentaliste et souvent classés selon une arborescence logique. Un annuaire ne peut rivaliser en volume avec les robots mais peut privilégier la qualité en ne référençant que de bons sites.


 

Toile visible et Toile invisible

Une part importante des ressources Internet n'est pas explorée par les robots des moteurs. Ce peut être lié à l'organisation de l'information en bases de données complexes ou à la volonté du producteur de contenu (accès réservé). Schématiquement, la toile visible peut être assimilée à celle explorée par les moteurs (Google : 3,5 milliards de pages). Medline constitue un bon exemple au sein de la Toile invisible puisque sa base (13 millions de références) n'est pas accessible aux robots. Toutefois, les mêmes articles peuvent être référencés et accessibles grâce au site de l'éditeur.


 

Sensibilité versus spécificité (bruit et silence)

Comme pour les tests médicaux, il est dificile d'avoir tous les avantages en même temps.
Les moteurs sont très "sensibles": Il est exceptionnel que Google ne donne pas au moins une réponse quelle que soit la requête. Par contre, cette sensibilité s'accompagne d'un bruit important: il propose souvent plusieurs dizaines de milliers de réponses dont la pertinence est aléatoire par rapport à l'attente de l'internaute.
A l'inverse, un annuaire peut être très "spécifique" et répondre à l'attente en ne fournisssant que quelques réponses mais peut se révéler assez souvent silencieux.


 

Recherche basique ou complexe ?

Pour limiter le bruit évoqué ci-dessus, il est souvent efficace d'ajouter une syntaxe minimale. Le plus souvent, les moteurs de recherche (généralistes ou internes à chaque site) admettent des séparateurs comme AND (ou +) ainsi que les guillemets qui recherchent une expression à l'identique. C'est le cas par exemple du moteur présent sur ce site.


 

Qu'est ce qu'un métamoteur ?

Il s'agit d'un moteur interrogeant plusieurs moteurs (ex: Kartoo) pour regrouper ensuite les résultats. En médecine, certains métamoteurs permettent d'interroger en une seule saisie plusieurs groupes de ressources intéressantes. C'est le cas par exemple de Trip Database et de Sumsearch. Dans un esprit voisin, le regroupement de formulaires d'interrogation au sein d'une page unique permet de gagner en efficacité y compris en consultation (voir La page du médecin).


 

Rien ne remplace l'expérience personnelle...

L'expérience acquise progressivement joue un rôle très important dans l'amélioration de l'efficacité. L'important est moins la connaissance d'une multitude de sites que le choix des bons outils en fonction du type de recherche à effectuer. Lire à ce propos Où trouver les réponses aux questions des cliniciens?


 

Bien chercher sur le site de la SNFGE

Le site de la SNFGE est conçu pour permettre différents niveaux de recherche en fonction du niveau de connaissances médicales de l'internaute. Voir la page Bien utiliser ce site.

particulière.

5 - Constituer une bibliographie sur un sujet médical

a) A partir des bases de PubMed (Medline) Savoir utiliser :
-   Le MeSH data base pour le choix du mot-clé, associé éventuellement à ses qualificatifs, sa pondération, et son explosion,
-   Les interfaces graphiques Limits et Index pour construire une requête pertinente
-   Les capacités de mapping,
-   La fonction History pour additionner des requêtes,
-   La fonction Détail pour vérifier son équation de requête et la modifier manuellement
-   La fonction de recherche d’articles sur un thème semblable à celui d’un article précis
-   Les fonctions pour ordonner et présenter ses résultats en mode texte,
-   Les fonctions d’enregistrement de la requête (My NCBI), de transformation en URL communicable à des collaborateurs, et d’envoi des résultats par messagerie.
-   La fonction de veille de My NCBI, avec envoi automatique d’e-mail informant régulièrement des nouveautés.
-   La fonction de vérification des libellés de références bibliographiques Savoir où chercher des articles en texte intégral libre d’accès (PubMed central, Linkout)

b) A partir d’Article@inist et de la BDSP

6 - Trouver des référentiels, recommandations et conférences de consensus francophones disponibles en ligne sur un sujet.

Savoir utiliser les bases de données de l’ANAES, du CISMeF, et trouver les sites des sociétés savantes productrices.

7 - Rechercher dans les bases de données du CHU de Rouen

Utilisant de trois possibilités d’entrées : par l’arborescence des mots-clés, l’index, et le moteur de recherche.

8 - Utiliser le portail des sites de santé publique d’Anasys (www.anasys.org).

Choisir, en fonction de ses objectifs, les sites présentant des référentiels de pratique, les moteurs de recherche de documentation médicale, les bases de données bibliographiques et de santé publique, les revues fournissant des articles en texte intégral, les sites-outils de l’internet utiles pour les activités de santé publique.

9 -

 

 

Thesaurus MeSH
Le thesaurus MeSH rassemble les 22 997 termes qui servent à indexer les documents :
- de la banque de données bibliographiques MEDLINE;
- des répertoires CISMeF (CHU de Rouen), DDRT (Karolinska Institutet) et OMNI (université de Nottingham);
- des banques de recommandations BFES (Banque française d'évaluation en santé), NGC (National guideline clearinghouse) et infobanque (Association médicale canadienne)
Thesaurus = vocabulaire contrôlé
Un thesaurus est un vocabulaire contrôlé dans lequel :
- chaque terme (appelé descripteur) représente sans ambiguïté une notion et une seule;
- les descripteurs ont entre eux des relations hiérarchiques, synonymiques et de proximité.

Les relations hiérarchiques
Respiratory Tract Diseases
    Bronchial Diseases
        Asthma
            Asthma, Exercise Induced
            Status Asthmaticus
Dans cet exemple, asthma est issu d'un descripteur de niveau hiérarchique supérieur (son descripteur-père Bronchial Diseases) et donne naissance à 2 descripteurs de niveau hiérarchique inférieur (ses descripteurs- fils Asthma, Exercise Induced et Status Asthmaticus).

Les relations synonymiques
Exemple : asthma a 5 entry terms (synonymes) : asthma ; asthma, bronchial ; asthmas, bronchial ; bronchial asthmas et bronchial asthma.
L'entrée de l'un quelconque de ces entry terms est interprétée en tant que asthma par l'interface PubMed.
Les relations de proximité
Exemple : anti-asthmatic agents est la relation de proximité de asthma.
Ces 3 types de relations sont rassemblés :
- dans la page asthma de MeSH database de PubMed,
- dans la page asthma de MeSH browser du site de la NLM,
où l'on retrouve :
- les 4 arborescences dans lesquelles figure le descripteur asthma (relations hiérarchiques);
- les 5 entry terms du descripteur asthma (relations synonymiques);
- le see also (antiasthmatic agents) de asthma (relation de proximité).

Note :
Les mêmes éléments figurent dans les espaces description et navigation du module Terminologie de CISMeF.

 

doc.edu

Epreuves classantes nationales

Recherche documentaire et autoformation


 
Accueil         Mémento Liens Quoi de neuf ?


 

Objectif : effectuer une recherche documentaire adaptée

En mettant à portée de clics des millions de documents médicaux et de notices bibliographiques, la Toile (le "Web") a bouleversé la recherche documentaire en médecine. Pour autant, la Toile n'a pas supprimé l'intérêt des bibliothèques universitaires (BU) qui restent le seul endroit où il est possible de mener à bien une recherche associant :
- l'interrogation (et la Toile est l'espace de choix),
- et l'accès aux documents (et la BU est souvent le dernier recours quand les documents hébergés sur la Toile ne sont pas en " libre accès ").

Sur la Toile, les modules de formation médicale initiale (et de formation continue) se distinguent par leur discrétion. Ceux qui s'appuient sur des objectifs pédagogiques précis se démarquent nettement de l'autoformation classique fondée sur la lecture des périodiques.

La recherche documentaire

Trois dates - Trois concepts

1989 : au Centre européen de recherche nucléaire à Genève (CERN), Tim Berners-Lee met au point l'HTML, un langage à balise qui permet de relier les documents entre eux. L'hypertexte, imaginé par Ted Nelson en 1965, se concrétise. La Toile est née.
1993 : Au National Center for Supercomputing Applications de Chicago, un étudiant de 21 ans Mark Andreessen développe une interface graphique (Mosaic) qui fait passer la Toile du statut d'espace réservé à une élite scientifique à celui d'espace accessible à tous. La Toile peut prendre son envol.
1997 : à la National Library of Medicine, le Vice-Président des Etats Unis Al Gore ouvre en grand l'accès à MEDLINE. Désormais, les internautes, quel que soit leur niveau d'instruction ou de revenu peuvent interroger " librement " la banque de données de référence en médecine. C'est la " grande première " de ce qu'on appellera plus tard l'Open Access.

Trois données fondamentales

Les documents

On les distingue en primaires, secondaires et tertiaires. Et il convient d'ajouter à la liste les documents qui appartiennent à la littérature grise.
Le document primaire est un " document qui présente une information à caractère original ". Exemples : article de périodique, thèse, communication de congrès, manuel, publication officielle…
Le document secondaire est " un document comportant des informations de nature signalétique et/ou analytique sur des documents primaires ". Exemples : les notices des banques de données bibliographiques, les fiches des bibliothèques.
Sous le nom de document tertiaire, " on regroupe soit des synthèses d'articles scientifiques (" mises au point ", reviews en anglais), soit des ouvrages de synthèse (état de l'art) ". Exemples : les " reviews " et, par extension les " systematic reviews " et les " méta-analyses ".
" La littérature grise regroupe divers types de documents non publiés ou publiés de façon restreinte : actes de congrès, thèses, rapports de recherche… Sans être confidentiels, ces textes échappent aux circuits éditoriaux habituels, sont difficilement repérables et accessibles ".
Toutes ces définitions sont empruntées au " Dictionnaire encyclopédique de l'information et de la documentation " - Edition Nathan 2001 .

Les langages

Le langage d'interrogation d'un outil de recherche est :
- soit libre et la requête se fait en langage courant ;
- soit soumis à des contraintes car le vocabulaire à employer est " imposé " et limité aux mots clés d'un index ou aux descripteurs d'un thésaurus.
Cette distinction est liée aux différents modes d'indexation des documents.
L'indexation de tous les mots du document, réalisée par un automate, permet l'interrogation en langage courant. Exemple : Google.
L'indexation des mots du titre et du résumé permet, elle aussi, l'interrogation en langage courant. Exemple : fonds documentaire de l'Inist.
L'indexation des mots qui caractérisent le document, effectuée par un documentaliste professionnel et rassemblée dans un bordereau d'indexation, justifie l'utilisation du même langage lors de la requête. Exemple : CISMeF
Plus le langage d'interrogation est libre, moins la réponse est adéquate. A l'inverse, plus il est " contrôlé ", plus la réponse est en adéquation avec la requête. Car l'utilisation des mêmes mots pour caractériser le document (c'est le travail du documentaliste) et pour décrire l'objet de la recherche (c'est ce que fait le praticien) est la condition pour obtenir la meilleure adéquation possible.
En médecine, le principal langage d'interrogation " structuré " est le thesaurus MeSH. C'est le langage d'interrogation de la banque de données bibliographiques MEDLINE. C'est aussi le langage des principaux répertoires de la Toile médicale (CISMeF, DDRT, Omni) et celui des banques de recommandations (Base française d'évaluation en santé, National Guideline Clearinghouse, Infobanque).
Note
Dans la réalité, les différences ne sont pas aussi tranchées.
C'est ainsi que CISMeF peut être interrogé en langage courant (utilisation du champ "plein texte" dans le module de recherche booléenne).
C'est ainsi que MEDLINE peut être interrogé en "anglais courant", les termes utilisés étant recherchés dans les titres et résumés (champ "Text Word").
Et le meilleur compromis possible entre sensibilité et précision est parfois obtenu en associant des descripteurs et des mots clés (en langage courant).

Les outils

La Toile visible est explorée par 3 types d'outils : les répertoires, les moteurs de recherche et les métamoteurs.
Les répertoires sont des listes hiérarchiques de mots clés en rapport avec des documents primaires. Ces listes sont établies par des documentalistes professionnels qui caractérisent chaque document à l'aide de mots clés. Avantage : la parfaite adéquation des réponses. Inconvénient : les répertoires sont souvent " sans voix " (sans réponses, faite d'avoir indexé un nombre suffisant de documents) ; c'est ce qu'on appelle le " silence ". Exemples de répertoires :DMOZ (le répertoire de Google), CISMeF.
Les moteurs de recherche sont des index géants constitués de tous les mots de toutes les pages rencontrées par un automate qui parcourt la Toile à longueur de journée. Avantage : ils sont rarement pris au dépourvu quand on les interroge car ils recensent une grande partie du contenu de la Toile visible (60 à 70%). Inconvénient : un grand nombre de leurs réponses sont très éloignées de l'objet de la recherche. C'est ce qu'on appelle le " bruit ". Exemples de moteurs de recherche : Google, AlltheWeb
Les métamoteurs sont des outils de recherche qui sollicitent simultanément plusieurs moteurs de recherche. Ceux qui explorent la Toile visible améliorent légèrement le pourcentage de Toile explorée, mais augmentent sensiblement le " bruit ". Exemple de métamoteur : Copernic.

La Toile invisible est constituée de banques de données dont la sollicitation par les outils de recherche classiques (répertoires et moteurs de recherche) est impossible, car elles ne peuvent être interrogées que par des interfaces spécifiques. Ces interfaces s'appellent :
- PubMed ou Knowledge Finder ou Ovid pour la banque de données bibliographiques MEDLINE ;
- article@inist, articleSciences ou ConnectSciences pour le fond documentaire de l'Inist ;
- Toxibase, Nosobase et Pediadol pour les banques de données du même nom.
Note : L'outil de recherche Sumsearch interroge à la fois la Toile visible (National guideline clearinghouse, Database of Abstracts of Reviews of Effects) et la Toile invisible (MEDLINE/PubMed).

Trois stratégies

Que la recherche documentaire soit initiée en bibliothèque ou devant un écran d'ordinateur, elle commence toujours par quelques questions simples :
- quel est l'objet de la recherche ? Quels sont les mots qui le définissent ?
- quel temps je souhaite consacrer à cette recherche ? En corollaire, est-ce que je souhaite être le plus sensible ou le plus précis possble ?
- quelle est la meilleure formulation de ma requête et quelle est la hiérarchie des éléments qui la composent ?
- pour cette recherche, quels sont les documents qui doivent être consultés (articles originaux, mises au point, articles didactiques, livres, thèses, documents audiovisuels...) ? Où trouver ces documents (sur la Toile ? Dans les bibliothèques universitaires ?).
Des données régulièrement actualisées sur toutes ces questions figurent dans les " Conseils aux étudiants pour une recherche d'information spécialisée efficace " (CERISE) mis en ligne par l'Urfist de Paris.

La stratégie est différente selon que la recherche concerne :
- une mise au point sur un thème général dans la perspective d'apprendre ou d'actualiser des connaissances ;
- les références d'un sujet précis dans la perspective de publier ou de communiquer ;
- les preuves d'efficacité d'un traitement ou d'opportunité d'un test diagnostique dans la perspective de prendre une décision à propos d'un patient.
La recherche de documents sur un thème médical général commence toujours par la sollicitation de CISMeF. En cas d'échec (fréquent), poursuivre avec l'interrogation du fonds documentaire de l'Inist, en sachant que les réponses se limiteront à des notices (documents secondaires). En dernier ressort, faire appel au moteur de recherche Google avec une requête très médicalisée (voir la fiche technique de l'outil).
La recherche des références sur une question précise ne peut se passer de l'interrogation des banques de données bibliographiques :
- soit le fonds documentaire de l'Inist, en sachant que l'adéquation n'est pas toujours au rendez-vous des réponses en raison du mode d'indexation des documents ;
- soit PubMed/MEDLINE en sachant que la langue anglaise et les publications anglophones " occupent le terrain ".
La recherche des preuves d'efficacité (d'un traitement) ou d'opportunité (d'une démarche diagnostique) reposent aussi sur l'interrogation :
- de PubMed/MEDLINE (fonctions " Clinical Queries " et " Systematic Review " et journal " Cochrane database of systematic reviews ") ;
- et des " petits maîtres " de l'Evidence-Based Medicine (DARE, BestBets, Bandolier).
Note sur "Google navigateur"
Google reste irremplaçable dès qu'il s'agit de retrouver l'adresse d'un site ou un document dont on connaît le titre exact. C'est la fonction "navigateur" de Google, magnifiée depuis qu'existe la "barre Google".

L'autoformation

Pendant longtemps, l'autoformation s'est limitée à la lecture des ouvrages et des périodiques et, à un moindre degré, à la sollicitation passive des moyens audiovisuels.
La Toile a modifié le profil de l'autoformation en la faisant bénéficier :
- de l'évolutivité, faisant du document en ligne un élément pouvant être corrigé, amélioré, complété à tout moment ;
- du non-séquentiel qui, grâce aux liens hypertexte, autorise les changements de parcours, les itinéraires personnels, les sauts de page… ;
- de l'accessibilité favorisée par le développement de la microinformatique et de l'Open Access.

Les sites d'autoformation varient dans leur forme et leur contenu pédagogique. La majorité d'entre eux se contentent de mettre en ligne les cours des facultés de médecine (réseau pédagogique de Rennes, polycopiés de santé de Lyon, corpus médical de Grenoble…). Tous ces cours sont facilement retrouvés en interrogeant CISMeF (mot clé MeSH + qualificatif " enseignement et éducation ") ou en sollicitant la rubrique étudiant de labibliothèque médicale Lemanissier.

L'Université médicale virtuelle francophone (UMVF) propose des " campus numériques " :
- structurés sur le modèle du campus numérique de gynécologie-obstétrique (Henri-Jean Philippe) ,
- dans différentes spécialités (dermatologie, neurologie, ophtalmologie, nutrition, pédiatrie, réanimation).
En modélisant la navigation, la structure de chaque document (prérequis - objectifs - FAQ - QCM - cas cliniques) facilite le travail de l'étudiant.

Trois sites d'autoformation s'appuient sur des méthodes pédagogiques du type " apprentissage par questions " (pour deux d'entre eux).
Section rachis (de la Société française de rhumatologie) fait figure de pionnier de la formation médicale sur la Toile dans un domaine très limité (la souffrance rachidienne). Le site est au point mort depuis décembre 2002. Il reste une vingtaine d'histoires cliniques (remarquablement mises en scène) à débrouiller.
Virtual Internet Patient Simulation (VIPS) propose quelques patients virtuels en démonstration. Les futurs patients virtuels du site sont en attente du soutien financier des associations de FMC ou des Sociétés savantes.
L'Unaformec a lancé en 2002 une série de patients virtuels sur le thème de la nutrition (eCoconut). Elle a été suivie par des séries sur l'ostéoporose, l'hypertension artérielle et les dyslipidémies.

D.U d'initiation au journalisme médical (Paris 5)
DES de médecine générale (Paris 13)

La recherche documentaire en médecine

Accueil         Mémento Liens Quoi de neuf ?

 

Dans leur recherche documentaire, le médecin généraliste et le journaliste médical privilégient la sollicitation des répertoires (CISMeF), des moteurs de recherche (Google) et des espaces documentaires institutionnels, universitaires ou associatifs.

La stratégie consiste à solliciter en priorité CISMeF pour les recherches sur les sujets médicaux généraux (les recommandations sur le traitement de l'asthme) et Google pour les recherches sur les thèmes plus spécifiques (quels sont les examens d'imagerie à effectuer en priorité en cas de suspicion d'un accident ischémique transitoire ?).

Dans de nombreux cas, les internautes chevronnés se passent de la sollicitation d'un outil de recherche. Au fil du temps, ils se sont constitués un carnet d'adresses de sites dans lesquels ils savent qu'ils ont les plus grandes chances de trouver ce qu'ils cherchent.

L'interrogation des banques de données bibliographiques (MEDLINE, PASCAL, EMBASE) reste le domaine privilégié des praticiens qui entreprennent une recherche bibliographique dans la perspective d'une publication (article original ou mise au point) ou d'une thèse. Il est rare que le médecin généraliste (ou le journaliste médical) se trouve dans une de ces situations.

La veille s'appuie sur les mêmes principes que la recherche documentaire.
Les sites qui affichent régulièrement leurs "nouveautés" sont privilégiés, de même que les lettres qui envoient régulièrement leurs informations les plus récentes. A terme, la Really Simple Syndication (fil RSS) doit simplifier (et anonymiser) la démarche de veille du praticien.
Les informations en provenance de la littérature médicale internationale sont rarement prisées par les médecins généralistes. Mais certaines données diffusées par l'université Mc Master  (BMJUpdates) ou par la National Library of Medicine  (My NCBI) méritent leur attention.

Bibliographie de la thèse

Comment faire la bibliographie de sa thèse ?

Index         Mémento Liens Quoi de neuf ?

Lors de la préparation de sa thèse, l'étudiant en médecine butte sur deux obstacles : la rédaction et la bibliographie.

L'objectif du "parcours du combattant" dont les différentes étapes figurent dans cette page (la préparation, l'interrogation, l'intégration) est de faciliter le franchissement de l'obstacle "bibliographie".

Avant de solliciter les banques de données et les catalogues des bibliothèques, vous devez savoir ce que vous allez leur demander. C'est le temps de la préparation pendant lequel vous allez cerner au plus près votre sujet de thèse, hiérarchiser ses différents composants, dresser la liste des synonymes et déterminer les limites de votre requête.

L'interrogation des outils de recherche n'est pas une sinécure. Sans maîtrise de la syntaxe et du langage, il n'y a pas d'inventaire possible des ressources médicales de la Toile. C'est d'abord un temps d'apprentissage, indispensable pour ne pas interroger une banque de données bibliographiques comme un vulgaire moteur de recherche, puis un temps de sollicitation des différents outils pour obtenir une première sélection d'articles.

Après avoir procédé à la "remontée des filières bibliographiques", il vous reste à faire votre sélection définitive des références.
Puis vient le temps de l'intégration et de la rédation des références pour lesquelles certaines règles et certains formats doivent être respectés.

doc.edu

Lexique

Explosion

Accueil         Mémento Liens Quoi de neuf ?

 
Définition
L'explosion d'un descripteur se définit par l'extension de la requête effectuée sur ce descripteur à ses descendants dans la liste hiérarchique où il figure.
L'explosion d'un qualificatif se définit de la même façon, les qualificatifs appartenant à des listes hiérarchiques.
Dans PubMed/MEDLINE, l'explosion d'un descripteur (ou d'un qualificatif) se fait par défaut.
Explosion d'un descripteur
L'entrée d'un descripteur dans la fenêtre d'interrogation de PubMed entraîne, par défaut, l'extension de la requête aux descripteurs issus de lui dans l'arborescence du thésaurus.
Exemple
La position du descripteur Inflammatory Bowel Diseases dans l'arborescence du thésaurus MeSH est la suivante :
Intestinal Diseases
        Inflammatory Bowel Diseases
                Colitis, Ulcerative
                Crohn Disease
Une requête sur Inflammatory Bowel Diseases est étendue aux descripteurs-fils (les descripteurs de niveau hiérarchique inférieur) : Colitis, Ulcerative et Crohn Disease
Note
Les descripteurs qui constituent les branches terminales de l'arborescence n'explosent pas (exemple : Crohn Disease ou Colitis, Ulcerative)
Explosion d'un qualificatif
Les 83 qualificatifs appartiennent à 19 familles, plus ou moins "nombreuses" :
- la famille microbiology n'a qu'un seul "descendant", le qualificatif virology ;
- la famille epidemiology en a 2, les qualificatifs mortality et ethnology ;
- la famille therapy en a 8, les qualificatifs diet therapy, drug therapy, nursing, prevention and control, radiotherapy, rehabilitation, surgery, transplantation.
L'explosion d'un qualificatif étend la requête effectuée sur ce qualificatif à ses descendants.
Exemple
Une recherche sur Pulmonary Embolism/epidemiology est étendue à Pulmonary Embolism/mortality et à Pulmonary Embolism/ethnology.
Syntaxe
Pour éviter le plénomène de l'explosion, il faut le préciser dans le champ qui suit l'affiliation descripteur/qualificatif.
Exemple
Tonsillitis/microbiology [mh:noexp] ou Tonsillitis/microbiology [majr:noexp].
Dans ce cas particulier, c'est une double explosion qui est évitée : celle de Tonsillitis qui a pour "descendant" Peritonsillar Abcess et celle de micriobiology, qui donne naissance à virology. Mais il est possible de dissocier l'explosion du descripteur et la non explosion du qualificatif (et inversement).
Exemples
Tonsillitis/microbiology [mh] NOT (Tonsillitis/virology [mh] OR Peritonsillar Abscess/virology) - Seul le descripteur est explosé.
Tonsillitis/microbiology [mh] NOT (Peritonsillar Abscess/microbiology [mh] OR Peritonsillar Abscess/virology [mh]) - Seul le qualificatif est explosé.
Intérêt
La question de l'explosion se pose rarement pour les descripteurs car ils appartiennent le plus souvent à l'un des deux niveaux hiérarchiques.
La question de l'explosion se pose principalement pour les qualificatifs. Certains ne sont pas explosés pour ne pas étendre la requête au delà des limites imposées par le thème.
Exemple avec le qualificatif diagnosis
La non-explosion évite l'affichage des notices relatives aux données anatomopathologiques ou d'imagerie quand la requête se limite au diagnostic clinique.
Gout/diagnosis [mh] (1605 notices le 3 mai 2005) ; Gout/diagnosis [mh:noexp] (952 notices le 3 mai 2005).
Exemple avec le qualificatif therapeutic use
La non-explosion évite l'affichage des notices relatives aux contre-indications ou aux effets indésirables quand la requête se limite aux indications.
Anticholesteremic Agents/therapeutic use [mh] (7776 notices le 3 mai 2005) ; Anticholesteremic Agents/therapeutic use [mh:noexp] (4230 notices le 3 mai 2005).

doc.edu

Mémento

Filtres

Accueil         Mémento Liens Quoi de neuf ?

 
Définition
Un filtre est une équation de recherche "toute faite" (parfois limitée à un seul "membre") qui, ajoutée à une autre équation, oriente le résultat de la requête. Les filtres sont principalement développés pour l'interrogation de MEDLINE.
Exemple:
Dans PubMed, une requête sur les causes des hypothyroïdies des personnes âgées s'écrit :
Hypothyroidism/etiology [mh] AND Aged [mh] NOT Adult [mh:noexp]
  • Avec le filtre des articles en libre accès, l'équation s'écrit :
    Hypothyroidism/etiology [mh] AND Aged [mh] NOT Adult [mh:noexp] AND free full text [filter]
  • Avec le filtre etiology (narrow, specific search) des Clinical Queries, l'équation
    Hypothyroidism/etiology [mh] AND Aged [mh] NOT Adult [mh:noexp]
    est entrée dans la fenêtre d'interrogation des Clinical Queries de PubMed (rubrique "PubMed Services" dans le cadre bleu à gauche de l'écran). Après avoir sélectionné "etiology" et "narrow, specific search", un clic de souris sur "GO" affiche le résultat.
    Le résultat correspond à l'équation (clic de souris sur "details") :
    (Hypothyroidism/etiology [mh] AND Aged [mh] NOT Adult [mh:noexp]) AND ((relative [tiab] AND risk* [tiab]) OR (relative risk [tw] OR risks [tw] OR Cohort Studies [mh:noexp] OR (cohort [tiab] AND stud* [tiab]))
 
Description
Dans PubMed, on distingue 3 types de filtres : les filtres EBM, les filtres de la série "filter" et les filtres "personnels".
  • Les filtres de la série "PubMed Clinical Queries"
    Les 2 principaux sont des filtres orientés "Evidence-Based Medicine".
    Search by Clinical Study Category
    Les filtres sont ceux développés par le Hedges Team de l'université McMaster (Brian Haynes). Ils concernent le diagnostic, le pronostic, le traitement, l'étiologie et l'évaluation et peuvent être orientés soit dans le sens de la précision (narrow) soit dans celui de la sensibilité (broad).
    Find systematic reviews
    En l'absence de type de publication spécifique pour les revues systématiques (méthodiques), le filtre "systematic reviews" sélectionne les revues systématiques, les méta-analyses, les conférences de consensus, les recommandations et les mises au point sur les essais cliniques.
  • Les filtres de la série "filter"
    De nombreux mots clés ou descripteurs appartiennent à la série "filter" : les catégories d'âge (adult, child, aged), les langues (german, french, english), les types de publication (editorial, letter, review), les clinical queries (diagnosis/broad, diagnosis/narrow), les sous rubriques (systematic, core clinical journals, free full text).
  • Les filtres personnels
    Ils sont développés pour palier certaines particularités du thésaurus MeSH, notamment le fait que les spécialités (cardiologie, pneumologie, dermatologie...) ne désignent pas les "pathologies" cardiaques, pulmonaires ou cutanées, mais la spécialité exercée par le cardiologue, le pneumologue ou le dermatologue.

 

Philippe Eveillard
Septembre 2005

 

doc.edu

Memento

Traduction
(d'un mot clé en descripteur MeSH)

Accueil         Mémento Liens Quoi de neuf ?

 
Contexte
Vous avez choisi les mots clés qui traduisent le thème de votre requête.
Vous souhaitez solliciter un outil de recherche qui explore un contenu indexé à l'aide des descripteurs MeSH.
Vous devez transformer les mots clés en descripteurs MeSH.
Vous disposez de 2 outils pour arriver à vos fins :
- le module Terminologie de CISMeF qui résout la majorité de vos problèmes ;
- l'interface PubMed qui supplée le module Terminologie quand celui-ci est défaillant.
Le module Terminologie de CISMeF
Le module Terminologie ne transforme un mot clé en descripteur MeSH que si le mot clé est le descripteur lui même ou l'un de ses synonymes (synonymes MeSH ou synonymes CISMeF).
La procédure est la suivante :
- entrée d'un mot clé simple dans la fenêtre recherche (les mots composés sont décomposés - si vous faites une recherche sur "arrêt cardiaque", vous n'entrez qu'un des 2 composants dans la fenêtre d'interrogation - "arrêt" ou "cardiaque") ;
- analyse des résultats (les descripteurs dont la liste s'affiche sous la fenêtre recherche) ;
- clic de souris sur le descripteur correspondant à votre recherche ;
- la page "description" qui s'affiche dans la partie droite de l'écran contient tous les renseignements dont vous avez besoin (et notamment l'intitulé des descripteurs MeSH en version originale et en version française).
Interface PubMed
PubMed est appelé à la rescousse dans les rares cas où le module Terminologie est en échec.
La traduction d'un mot clé en termes du MeSH comporte 3 étapes :
- traduction du mot clé français en mot clé anglais à l'aide d'un des dictionnaires en ligne sur la Toile (Grand dictionnaire terminologique ou Atlas sémantique) ;
- interrogation de PubMed à l'aide du mot clé anglais considéré comme un mot du titre (champ [ti]);
- affichage du bordereau d'indexation des premières notices portant la mention "indexed for MEDLINE". Analyse des descripteurs MeSH figurant dans chaque bordereau et sélection de celui qui correspond au sens du mot clé.
Exemple
Recherche de la traduction en langage MeSH de traitement conservateur (dans le contexte du traitement du cancer du sein).
Le Grand dictionnaire terminologique propose conservative treatment.
L'équation Breast Neoplasms [mh] AND conservative treatment [ti] est entrée dans la fenêtre d'interrogation de PubMed.
Dans le bordereau d'indexation de plusieurs notices figure le descripteur Mastectomy, Segmental.
La confirmation est fournie par le module Terminologie de CISMeF : Mastectomy, Segmental a comme synonyme Breast-Conserving Surgery.

 

Philippe Eveillard
Novembre 2005

doc.edu

Mémento

Répertoire

Accueil         Mémento Liens Quoi de neuf ?

 
Définition
Les répertoires sont des listes de mots clés établies par des documentalistes professionnels.
Ces listes sont explorées :
- soit en parcourant des arborescences (listes hiérarchiques) ou un index (liste alphabétique);
- soit, plus rarement, en entrant un mot clé dans une fenêtre d'interrogation.
Le meilleur exemple est le répertoire créé et maintenu par l'Open Directory Project. C'est un modèle de liste hiérarchique où le parcours à travers une arborescence de termes conduit au mot clé qui corrrespond à la demande de l'utilisateur.
Qualité : l'adéquation
L'intervention d'un professionnel de la documentation dans l'indexation (la caractérisation) des documents explique :
- les capacités limitées des répertoires (il faudrait une armée de documentalistes pour indexer le contenu de la Toile visible);
- la bonne adéquation de leurs réponses aux requêtes des utilisateurs ; cette "bonne adéquation" est la grande qualité des répertoires.
Défaut : le silence
Le risque des répertoires est de n'afficher aucune réponse alors que des documents en rapport avec la requête existent dans l'espace interrogé. C'est le "silence".
Le risque de silence est d'autant plus grand que la requête est plus complexe (plusieurs mots clés) ou plus ciblée. C'est la raison pour laquelle, la sollicitation d'un répertoire est un bon choix stratégique pour peu que la requête concerne un sujet général.
Les principaux répertoires
Sur la Toile médicale francophone, le répertoire de référence est CISMeF, créé et maintenu par l'équipe du CHU de Rouen.
Sur la Toile médicale anglophone, on peut citer :
- les répertoires "MeSH dépendants" (indexés à l'aide des termes MeSH) comme OMNI ou DDRT;
- les répertoires "non MeSH dépendants" comme Martindale's Health Science Guide ouHardin Meta Directory.

 

Philippe Eveillard
Avril 2005

doc.edu

Lexique

Opérateur booléen

Accueil         Mémento Liens Quoi de neuf ?

 
Définition
Les opérateurs booléens* (ou opérateurs logiques) décrivent les relations qui peuvent exister entre 2 mots clés.
* George Boole, mathématien anglais du XIXè siècle, a été le premier à s'intéresser aux opérateurs logiques.
Description
Dans PubMed/MEDLINE les opérateurs booléens sont AND, OR et NOT.
  • AND restreint le champ de la requête.
    Exemple
    Kidney Failure, Chronic/etiology [mh] AND Diabetes Mellitus/complications [mh]
    La recherche porte sur les notices dans le bordereau d'indexation desquelles figurent l'ensemble descripteur/qualificatif Kidney Failure, Chronic/etiology et l'ensemble descripteur/qualificatif Diabetes Mellitus/complications
  • OR élargit le champ de la requête
    Exemple
    Kidney Failure, Chronic/etiology [mh] OR Diabetes Mellitus/complications [mh]
    La recherche porte sur les notices dans le bordereau d'indexation desquelles figure l'ensemble descripteur/qualificatif Kidney Failure, Chronic/etiology, sur celles dans le bordereau d'indexation desquelles figure l'ensemble descripteur/qualificatif Diabetes Mellitus/complications et sur celles dans le bordereau d'indexation desquelles figurent les 2 ensembles descripteur/qualificatif .
  • NOT exclut du champ de la requête
    Exemple
    Kidney Failure, Chronic/etiology [mh] NOT Diabetes Mellitus/complications [mh]
    La recherche porte sur les notices dans le bordereau d'indexation desquelles figure l'ensemble descripteur/qualificatif Kidney Failure, Chronic/etiology à l'exception de celles dans le bordereau d'indexation desquelles figure l'ensemble descripteur/qualificatif Diabetes Mellitus/complications

     
Syntaxe
Les opérateurs booléens sont saisis en lettres capitales.
La mise entre parenthèses des mots clés encadrant l'opérateur booléen OR est impérative dès que, dans l'équation de recherche, OR est en compagnie d'un ou des deux autres opérateurs booléens.
Exemples
Crohn Disease/therapy [mh] AND (Guidelines [mh] OR guideline [pt])
Bronchiectasis/diagnosis [mh] AND Child [mh] NOT (Adult [mh] OR Adolescent [mh])

 

Philippe Eveillard
Avril 2005

doc.edu

Mémento

Mapping

Accueil         Mémento Liens Quoi de neuf ?

 
Définition
Le mapping est l'interprétation d'un mot ou d'une expression dans le sens le plus approprié pour l'outil de recherche considéré.
Exemple :
L'entrée de alcoholic cirrhosis dans la fenêtre d'interrogation de PubMed/MEDLINE est interprétée (mapping automatique) comme étant le mot clé alcoholic cirrhosis, le mot clé alcoholic liver cirrhosis ou le descripteur MeSH Liver Cirrhosis, Alcoholic.
En témoigne le contenu du cadre de la fonction "Details" :
"alcoholic liver cirrhosis"[Text Word] OR "liver cirrhosis, alcoholic"[MeSH Terms] OR alcoholic cirrhosis[Text Word]
Le répertoire CISMeF et les interfaces d'interrogation de MEDLINE (PubMed et NLM Gateway) ont des fonctions de mapping.
CISMeF
Le répertoire CISMeF propose deux types de mapping : un mapping de type "traduction" (dans l'espace Terminologie) et un mapping de type "interprétation" (avec le module de recherche simple).
L'espace Terminologie permet de rechercher les correspondances entre un mot (ou la racine d'un mot) et les descripteurs et qualificatifs du langage MeSH. C'est un outil qui présente de nombreuses parentés avec le MeSH bilingue.
Le module de recherche simple "interprète" le mot clé (ou l'expression) entré dans sa fenêtre d'interrogation.
Exemple :
L'entrée de pelvispondylite affiche 8 ressources (le 22 juillet 2005). Le degré d'adéquation de la requête (par rapport au langage MeSH) est médiocre (une étoile sur une échelle de 1 à 5). En revanche, pelvispondylite rhumatismale bénéficie d'un degré d'adéquation bien meilleur (5 étoiles) en tant que synonyme du descripteur spondylarthrite ankylosante
PubMed
Le mapping automatique de PubMed (automatic term mapping) consiste à comparer les mots entrés (sans indication de leur champ) dans la fenêtre d'interrogation de PubMed à différentes tables de correspondance.
Sont passés successivement en revue (jusqu'à l'obtention d'un résultat) :
- la table des descripteurs, synonymes des descripteurs, qualificatifs et types de publication du MeSH ;
- la table des journaux médicaux et celle des auteurs.
Si les comparaisons successives d'un mot composé ne donnent aucun résultat, le mot est décomposé et chacun de ses composants bénéficie d'un nouveau "mapping".
Exemples :
Congestive heart failure ---> "heart failure, congestive" [MeSH Terms] OR congestive heart failure [Text Word]
Occupational asthma ---> occupational [All Fields] AND ("asthma" [MeSH Terms] OR asthma [Text Word])
NLM Gateway
NLM Gateway est une interface qui ne se contente pas d'interroger MEDLINE, mais étend le champ de ses requêtes à MEDLINE Plus, Toxline, Clinical Trials...
Dans la barre de menu, l'activation de Term Finder affiche une fenêtre d'interrogation dans laquelle est entré le mot ou l'expression devant bénéficier du mapping. Term Finder sélectionne les termes du thesaurus MeSH et du métathésaurus UMLS (Unified Medical Language System).
L'entrée d'un mot clé (qui n'est pas un terme MeSH) dans la fenêtre d'interrogation de Term Finder entraîne un "mapping" de l'UMLS et la recherche d'un éventuel descripteur MeSH "associé". En l'absence de descripteur MeSH "associé", une liste de termes en relation avec le mot clé est affichée.
Exemple :
Orbitopathy --> Grave's Diseases (descripteur MeSH)
                   -->Endocrine exophtalmos (terme non-MeSH)

 

Philippe Eveillard
Juillet 2005

Qualificatif

Accueil         Mémento Liens Quoi de neuf ?

 
Définition
Un qualificatif est un mot qui "affilié" à undescripteur en précise le sens.
L'affiliation se traduit par un slash entre le descripteur et le qualificatif comme dans :
Asthma/diagnosis ; Fibrinolytic Agents/adverse effects ; Air Pollution/legislation and jurisprudence.
Intérêt
Dans les bordereaux d'indexation, pratiquement tous les descripteurs sont "qualifiés", à l'exception :
- des check tags (male, femelle, comparative study, in vitro, English Abstract) ;
- des groupes d'âge (adolescent, adult, aged, child, infant...).
Cette qualification quasi systématique des descripteurs est la meilleure façon d'affiner l'indexation des articles, c'est-à-dire de caractériser "au plus près" les documents. Cela n'a d'intérêt que si l'utilisateur (celui qui élabore la requête) joue le même jeu et "qualifie" ses descripteurs, ce qui permet d'obtenir la meilleure adéquation possible entre la demande (la requête) et la réponse (les notices affichées).
Chaque catégorie de descripteurs a son lot de qualificatifs
Tous les qualificatifs (il y en a 83) ne sont pas "affiliables" à chaque descripteur. Certains sont plus spécifiques des maladies, d'autres des médicaments, d'autres des investigations diagnostiques...
Ainsi :
- diagnosis, epidemiology, etiology, drug therapy, complications, prevention and control, surgery, radiography... sont les qualificatifs les plus couramment affiliés aux maladies ;
- adverse effects, administration and dosage, contraindications, antagonists and inhibitors, pharmacology, toxicity, therapeutic use...sont affiliés aux médicaments et classes thérapeutiques.
En cas d'hésitation (ce qualificatif convient-il à ce descripteur ?), il faut :
- soit vérifier l'adéquation dans le module Terminologie de CISMeF ;
- soit, éventuellement, solliciter la MeSH Database (sur le site de PubMed) ou interroger le MeSH Browser (sur le site de la National Library of Medicine).
 
Correspondances
Lorsqu'une équation contient plusieurs descripteurs, il est parfois possible d'établir des correspondances entre leurs qualificatifs. C'est le cas quand sont associés :
- un médicament (qualificatif : therapeutic use) et une maladie (qualificatif : drug therapy)
Heart Failure, Congestive/drug therapy [mh] AND Adrenergic Beta-Antagonists/therapeutic use [mh]
- un médicament (qualificatif : adverse effects) et une affection iatrogène (qualificatif : chemically induced)
Antiinflammatory Agents/adverse effects [mh] AND Myocardial Infarction/chemically induced [mh]
- deux maladies dont l'une est la complication de l'autre
Kidney Failure, Chronic/etiology [mh] AND Diabetes Mellitus/complications [mh]
L'explosion des qualificatifs
Comme les descripteurs, les qualificatifs ont entre eux des relations hiérarchiques.
Les 19 branches maîtresses (les 19 "familles") donnent naissance à des qualificatifs de niveau hiérarchique inférieur.
Exemple
La famille diagnosis donne naissance aux qualificatifs pathology, radiography, radionuclide imaging, ultrasonography.
Le phénomène de l'explosion se produisant par défaut, toute recherche dont le qualificatif est diagnosis est étendue aux qualificatifs pathology, radiography, radionuclide imaging, ultrasonography (voir l'arborescence des qualificatifs et l'article explosion du lexique)

 

Philippe Eveillard

CISMeF: pourquoi, comment

[CISMeF: menu général] [Guide d'utilisation] [English version] 
[Revue de presse]


Ce document a été réalisé par l'équipe CISMeF.

Résumé
Prix, partenaires et financements
Mots-clés (MeSH)
1. Introduction
2. Matériel et méthodes
   2.1. Matériel et logiciel
    2.2. Standards

3. Réalisation du catalogue
    3.1 Le caractère francophone
    3.2. Le recensement des sites et des documents
    3.3. Filtrage et sélection : comment l'information est validée
    3.4. Description et indexation
    3.5. Structure du catalogue, classification
4. Résultats
    4.1. Statistiques d'utilisation de CISMeF
5. Discussion
6. Justification
7. Perspectives
Références

Résumé

L'Internet est aujourd'hui devenu une source majeure et incontournable d'informations de santé. Ce projet a pour objectif le Catalogage et l'Indexation des Sites Médicaux Francophones (acronyme : CISMeF) accessibles sur l'Internet. 

CISMeF est un projet initié par le Centre Hospitalier Universitaire de Rouen - Hôpitaux de Rouen. Il a débuté dès l'existence du site Web du CHU en février 1995. Son adresse URL est http://www.chu-rouen.fr/cismef/ ou http://www.cismef.org/. Ce catalogue indexe les principaux sites et documents francophones. Il a dépassé les 12.000 ressources indexées en juin 2003 avec une moyenne de 55 nouvelles ressources par semaine en 2003. 

Cette liste de sites contient un classement thématique, en particulier des spécialités médicales, un classement alphabétique, et un accès par type de ressources. Depuis juin 2000, l'outil associé, Doc'CISMeF, permet d'effectuer des recherches dans le catalogue de ressources, et offre des possibilités de recherche plus étendues. 

CISMeF utilise deux outils standards pour organiser l'information : le thesaurus MeSH (Medical Subject Headings) utilisé notamment pour la base de données bibliographique Medline et le format de métadonnées du Dublin Core. Chaque site indexé comprend une notice descriptive. CISMeF adhère aux principes de qualité de l'information de santé sur l'Internet (Net Scoring), développé en collaboration avec Centrale Santé. CISMeF est un outil utile pour la communauté francophone, professionnel de santé ou cyber-citoyen : chaque jour ouvré, 15.000 ordinateurs se connectent sur ce site représentant environ 20.000 personnes.

 

Prix, partenaires et financements

Dans le cadre de la procédure "Autoroutes de l'Information", CISMeF a obtenu en mars 1998 le label "Expérimentation d'Intérêt Public" par le Comité Interministériel des Autoroutes et Services de l'Information.

Depuis novembre 1998, CISMeF fait partie des actions prioritaires financées par l'Agence Universitaire de la Francophonie (AUF) dans le cadre du programme de l'Université Virtuelle Francophone (UVF). 

Dans le cadre du programme Educnet, Doc'CISMeF a obtenu en juin 2000 un financement par le Ministère de la recherche.

Stéfan Darmoni et Benoit Thirion, coordinateurs du projet CISMeF, ont obtenu, pour ce travail, le titre de Lauréats de l'Académie nationale de médecine par l'attribution du prix Albert Sézary en octobre 2000.

CISMeF a obtenu le prix des jeudis de l'ATICA aux Electrophées 2003, dans la catégorie "Réutilisation des données et XML".

Pour plus de détails, voir les partenaires et les financements de CISMeF.

 

Pour obtenir d'avantage de détails sur l'utilisation de CISMeF et de Doc'CISMeF, nous avons également écrit un guide d'utilisation.

 

Mots-clés (MeSH)

Analyse et indexation [abstracting and indexing] ; catalogage [cataloging] ; France; Internet; MEDLINE ; National Library of Medicine (U.S.) ; descripteur [subject headings] ; subvention gouvernementale non USA [support, non-U.S. gov't]; vocabulaire contrôlé [vocabulary, controlled] ;

 

1. Introduction

L'Internet est devenu aujourd'hui une source majeure et incontournable d'informations scientifiques et médicales [Schatz97]. Pour le professionnel de santé, trouver l'information adéquate sur l'Internet n'est pas une tâche aisée [Thirion98]; d'où la multiplication des annuaires et des outils de recherche [Flannery95]. Mais par expérience, les sites-catalogues généralistes, comme Yahoo France [http://www.yahoo.fr/], Voilà [http://www.voila.fr/] ou encore Lycos [http://www.lycos.fr/] et les moteurs de recherche comme Altavista [http://www.altavista.digital.com/] ou Google  [http://www.google.fr/] ne nous ont jamais permis d’obtenir de manière claire et organisée une présentation de l’information disponible en médecine, limitant ainsi son utilisation potentielle. En neurologie par exemple, un panorama des ressources disponibles n’existe pas. Ces sites-catalogues généralistes et ces moteurs de recherche contiennent pourtant un nombre impressionnant de sites médicaux mais l’organisation et la hiérarchie de leurs données ne sont pas adaptées à la médecine. Nous avons besoin d’une classification spécialisée et hiérarchisée dont la consultation de l’arborescence permet d’" en savoir plus " en s’élevant ou en descendant dans la hiérarchie.

Pour assister le professionnel de santé dans sa quête d’informations électroniques, certains sites tentent de recenser manuellement ou automatiquement les différents sites existants. En effet, l’Internet a engendré un changement de paradigme : il a permis de passer de la problématique de l’accès à l’information à celle du tri dans l’avalanche d’informations.

Il nous paraît  illusoire, sans l’aide d’une classification humaine rigoureuse, d’organiser de façon cohérente des ressources aussi diverses que des associations de patients, journaux électroniques, listes de diffusion, recommandations de bonne pratique clinique, unités INSERM, etc... Une sélection humaine rigoureuse, effectuée par des professionnels de l’information appuyés par des réseaux d’experts, nous paraît être actuellement l’approche la plus raisonnable et la plus efficace pour avoir accès à une partie de la richesse inouïe de ce réseau. Il devient donc urgent, devant l’ampleur de la tâche, de mettre en place des projets coopératifs et de construire des sites fédérateurs d’initiatives visant à sélectionner, décrire et indexer les ressources présentes sur l’Internet. Le catalogage partagé est plus que jamais d’actualité.

Le but de CISMeF est d’assister les professionnels de santé dans leurs quêtes d’informations et de connaissances électroniques disponibles sur l’Internet. CISMeF est un projet initié par le Centre Hospitalo-Universitaire (CHU) de Rouen. Son URL (Universal Resource Locator) est http://www.chu-rouen.fr/cismef/. CISMeF a débuté en février 1995, dès la création du site Web du CHU de Rouen qui fut le premier créé d'un hôpital français (SJ. Darmoni et B. Thirion en sont les deux maitres-toile).

Le cadre de CISMeF est centré sur la santé et les sciences médicales, dépassant la médecine proprement dite. Trois axes prioritaires ont été définis : les ressources concernant l'enseignement, la médecine factuelle (recommandations pour la bonne pratique clinique et conférence de consensus) et les documents spécialement destinés aux patients et au grand public, dans le but de participer à l'amélioration de l'éducation sanitaire dans le monde francophone.

En juin 2003, CISMeF recense 12.291 ressources. Face au nombre croissant de ressources intégrées au catalogue et au besoin de répondre à des requêtes de plus en plus précises, le CHU de Rouen a initié un nouveau projet : la création de Doc'CISMeF en juin 2000. Doc'CISMeF est l'outil qui permet d'effectuer des recherches dans le catalogue de ressources CISMeF, en proposant des possibilités de recherche plus étendues et plus performantes, tout en utilisant la même structure de modèle d'information

En conclusion, la création du " site-catalogue " manuel CISMeF est justifiée par : (a) l'avalanche d'informations potentiellement accessibles, (b) la difficulté de séparer clairement les informations pour les professionnels de celles pour les patients, (c) le manque de spécificité des moteurs de recherche [Darmoni 96] tels qu’Alta Vista quand on les compare aux meilleurs sites-catalogues qui utilisent le thesaurus de Medline pour indexer les sites, et enfin et surtout, (d) la nécessité absolue en médecine de connaître la source et la qualité de l'information. Il est difficile, surtout pour les plus jeunes et les débutants, d'évaluer la qualité des sites.

2. Matériel et méthodes

2.1. Matériel et logiciel

CISMeF a été implanté depuis son origine en février 1995 sur une machine SUN avec Unix comme système d'exploitation. Nous avons changé de machine et de système d'exploitation en octobre 1999. Le serveur http utilisé est aujourd'hui un serveur Apache (serveur HTTP Apache 1.3.6., sous Linux Redhat).
Doc'CISMeF utilise Windoxs 2000 server, avec le serveur d'application HTTP Tomcat 4.0.2. et une base ORACLE 8.1.7.

Nous avons successivement utilisé différents logiciels de statistiques, Getstats version 1.2., NetIntellect, puis enfin Webtrends version 4.5) pour évaluer l'utilisation de ce site après exclusion des requêtes effectuées par les machines du CHU.

2.2. Standards

CISMeF est réalisé en HTML statique. Nous avons originellement utilisé le standard HTML 2.0 pour que ce site soit lisible par la grande majorité des navigateurs. Nous utilisons maintenant le standard plus récent HTML 4.0. Depuis juin 2001, le standard XML est également utilisé, pour permettre une interopérabilité avec d'autres catalogues ou serveurs de ressources (voir un exemple de notice au format HTML et XML). 

Nous utilisons le format RDF (into HTML) pour présenter toutes nos métadonnées.

Ce catalogue utilise également des outils standards pour organiser l'information : plusieurs ensembles d’éléments de métadonnées (données concernant les données) dont l’objectif est d’améliorer la recherche d’information (nous utilisons notamment le format de méta-données du Dublin Core [Panchyshyn], et les métadonnées HIDDEL) ainsi que le thesaurus MeSH (Medical Subject headings) utilisé notamment pour la base de données bibliographique Medline [NLM98a].

3. Réalisation du catalogue

3.1 Le caractère francophone

En novembre 1994, lors de la connexion initiale du CHU de Rouen à l'Internet, nous avons rapidement constaté l'absence de "sites-catalogues" des ressources francophones dans la santé. Il existait en revanche d'excellents "sites-catalogue" anglophones.

CISMeF recense exclusivement les ressources en français de toute provenance. Nous ne cataloguons pas les sites français de langue anglaise. Le nombre de sites et documents catalogués dans CISMeF atteint les 12.300 en juin 2003, avec 55 nouvelles ressources en moyenne par semaine en 2003 ; nous estimons que ce nombre représente environ 10 % de la production mondiale, celle-ci est en grande majorité en anglais.

CISMeF affirme également la présence du français et de la France sur l'Internet. La méthodologie CISMeF comprend 3 étapes : recensement des ressources, filtrage et sélection, description et indexation. Une aide bibliothécaire est en charge du recensement des nouveaux sites, quatre  documentalistes sont chargées de leur description et indexation. Le responsable de la bibliothèque médicale est "super-indexeur", en charge de la vérification de l'indexation. Des réunions fréquentes avec les deux médecins informaticiens permettent l'étude des cas difficiles.

3.2. Le recensement des sites et des documents

Le recensement des sites et des documents est effectué grâce à une veille quotidienne sur les annuaires multidisciplinaires francophones permettant une consultation de leurs nouveautés : Nomade, Toile du Québec, Yahoo, .... En 2003, un total de 2.229 administrateurs de sites (maître-toile), soit 17 % des ressources indexées, nous ont signalé leur existence : la plupart ne répondent aux critères de sélection de CISMeF. Une veille complémentaire est effectuée sur des sites producteurs de documents : ministères, agences gouvernementales, sociétés savantes. Enfin une visite régulière de sites majeurs en médecine et une lecture de la presse médicale et des quotidiens nationaux nous permettent de compléter notre recensement. Sont indexées en priorité les sites des institutions et des sociétés savantes ainsi que la documentation en émanant : recommandations pour bonne pratique clinique, conférences de consensus, matériels d'enseignement, et rapports. Les ressources concernant l'enseignement ainsi que les informations à destination des patients font également partie de nos axes prioritaires.  

La politique éditoriale de CISMeF a progressivement évolué concernant les sites commerciaux : depuis le début de l'année 2000, nous ne les recensons plus. Ainsi, pour connaître les sites commerciaux dans la santé, nous conseillons d'utiliser d'autres outils de recherche. CISMeF ne recense maintenant que les sites institutionnels et documents en émanant. Les sites personnels de patients sont exceptionnellement acceptés.

        3.3. Filtrage et sélection : comment l'information est validée

Dans l'objectif de n'inclure que des ressources de qualité, CISMeF utilise le référentiel des critères de qualité de l'information de santé sur l'Internet (Net Scoring), développé en collaboration avec Centrale Santé,  groupe de travail français fédéré par l'Ecole Centrale de Paris. Ce groupement professionnel est destiné à réunir les ingénieurs intéressés par l'ingénierie des technologies en santé et des professionnels de santé afin d'offrir une plate-forme neutre de réflexion. Le groupe de réflexion sur le Net Scoring a réuni médecins, bibliothécaires médicaux, ingénieurs et juristes. Il a collaboré avec APUI-Santé (laboratoire des technologies de l'information unifiant des réseaux de savoir et de compétences par différents réseaux numériques). 

Le Net Scoring comprend 49 critères regroupés en huit classes principales : crédiblité, contenu, hyper-liens, design, interactivité, aspects quantitatifs, déontologie, et accessibilité. Certains de ces critères sont inspirés d'un livre blanc américain [Ambre97]. Ces critères permettront d’appliquer aux différents sites un ou plusieurs scores tenant compte entre autres des éléments suivants :

Il nous a semblé impératif que le projet CISMeF respecte également ces critères de qualité de l'information de santé. Nous attachons une attention toute particulière au fait que les auteurs doivent être clairement identifiés et les cibles indiquées avec précision. Cela nécessite parfois quelques courriels avec les responsables des sites.

La description d’un site doit également permettre d’évaluer la qualité de l’information fournie. Certains sont refusés, notamment parce qu'ils ne respectent pas certains critères déontologiques. Nous ne recensons pas les sites personnels, sauf s'ils contiennent un contenu informationnel de grande qualité. L’information sur un site n’est valable bien sûr qu’à l’instant " t "   et la qualité du site devra être révisée périodiquement.
Nous nous appuyons également, pour valider certaines ressources, sur un réseau d'experts locaux ou externes à notre institution, constitué au fil du temps et composé de professionnels de santé à même de juger de l'utilité et de la qualité des sites à indexer.

En ce qui concerne le site Web du CHU de Rouen, qui englobe le projet CISMeF, un comité de rédaction a été mis en place en décembre 1996, suite à la volonté des instances de l'établissement de disposer d'une structure de contrôle du développement d'Internet dans le sens d'une évaluation de la qualité et de la cohérence. Ce comité contrôle le fond et la forme (respect de la charte graphique), avec une évaluation externe si nécessaire ; la validité de l'information sur l'Internet doit être systématiquement remise en cause, car, par opposition avec notre existant papier fondé sur les comités de pairs, l'information disponible sur ce réseau n'a pas été évaluée par ceux-ci dans l'extrême majorité des cas. 

3.4 Description et indexation

Le catalogage d’un site se justifie à double titre : connaître à l’avance le type d’information présente (gain de temps) et évaluer son contenu.

Chaque ressource est décrite à l'aide des champs suivants, parmi les 15 du projet Dublin Core : titre, auteur, description, site éditeur, date, identifiant (url), format, langue, mots clés et types de ressources. Sept autres champs sont spécifiques de CISMeF et Doc'CISMeF : institution, ville, département, pays, coût, parrainage, public concerné.

Concernant les ressources pédagogiques, destinées aux étudiants, certains éléments du format IEEE 1484 Learning Object Metadata (LOM) ("cycle" et "année d'études" par exemple) sont ajoutés. Nous utilisons 11 éléments de la catégorie "Educational" de LOM, en attendant la création définitive du DC.Education qui s'inspirera du format LOM. S'il s'agit d'un document répondant à une question d'internat, nous indiquons le numéro de la question concernée (établi selon un classement national).

Pour les ressources de médecine factuelle, CISMeF a défini deux champs spécifiques : "indication du niveau de preuve" et "méthode" pour le déterminer.

Actuellement, nous indiquons dans les métadonnées de nos documents HTML les éléments suivants du Dublin Core :

<meta name="DC.Creator" content="équipe CISMeF ; cismef@chu-rouen.fr">
<meta name="DC.Format" content="(SCHEME=IMT)text/html">
<meta name="DC.Language" content="(SCHEME=RFC1766)fr">
<meta name="DC.Publisher" content="Rouen University Hospital ; Centre hospitalier universitaire de Rouen ">
<meta name="DC.Rights" content="Copyright CHU de Rouen. Toute utilisation partielle ou totale de ce document doit mentionner la source">
<meta name="DC.Subject.Keywords" content="(SCHEME=MeSH)sérologie HIV; AIDS serodiagnosis">

Plusieurs sites dans la santé ont adopté le Dublin Core : citons Australian Department of Health and Aged Care [http://www.health.gov.au/], Better Health Channel [http://www.betterhealth.vic.gov.au/], National Health and Medical Research Council [http://www.nhmrc.health.gov.au/], et l’OMS (Organisation Mondiale de la Santé) [http://www.oms.ch/]. 
Pour en savoir plus, voir l'utilisation des métadonnées Dublin Core dans le domaine de la santé et un article en anglais détaillant l'utilisation du Dublin Core dans CISMeF.

Nous avons choisi le thésaurus MeSH, utilisé notamment pour Medline qui est la base de données bibliographiques la plus utilisée au monde. Elle est produite par la bibliothèque nationale américaine de médecine (National Library of Medicine-US). Son thésaurus a l'avantage d'être précis, rigoureux et mis à jour annuellement. Il contient plus de 22.000 termes dans la version 2003 : les MeSH (Medical Subject Headings) . Ces termes sont organisés hiérarchiquement sur 9 niveaux. Nous utilisons également la traduction en français de ces mots clés, réalisée par le réseau DiscDoc de l’Institut National de la Santé et de la Recherche Médicale (INSERM). Dans certains cas qui restent rares, les ressources ne peuvent être parfaitement indexées avec le MeSH ; nous utilisons alors un "mapping" manuel pour rechercher le terme MeSH le plus propre, par exemple les ressources traitant de dysmélie ont été indexées avec le terme MeSH ectromélie.

Avant 2001, notre indexation ne tenait compte que des thèmes traités de manière importante. Ainsi, la pondération existante dans Medline (MeSH Major Topic qui est la possibilité de réduire une recherche aux références les plus pertinentes) n'était pas utilisée, chaque mot clé étant de facto considéré comme majeur dans CISMeF. Depuis 2001, toutes les ressources sont indexées avec des mots clé en majeur ou mineur.

De même les qualificatifs, qui permettent de préciser le sens d'un mot clé, et d'en souligner un aspect particulier, ne sont pas utilisés de façon aussi systématique dans CISMeF que dans Medline. La localisation géographique est mentionnée, lorsqu’elle peut compléter une information, pour une association ou un hôpital par exemple.

Bibliothèque médicale et scientifique de l'IGR [site éditeur IGR Institut Gustave Roussy. Centre européen de lutte contre le cancer ; renseignements pratiques, présentation des collections et des services]. Villejuif-Fr
mots clés : oncologie médicale
type : bibliothèque

L'indexation est susceptible de varier entre les différents indexeurs. Le niveau d'accord dans le choix des termes est appelé consistance. Voici les chiffres pour la consistance de CISMeF (mesurée avec un échantillon de 10 ressources, méthode de Hooper [Hooper65]) :
- La consistance globale est de 30%
- La consistance sur les mot clés MeSH majeurs est de 40%
- La consistance pour les types de ressources est de 55%.

La description d’un site doit aussi permettre d’évaluer la qualité de l’information fournie. Ce point est fondamental en particulier dans le domaine de la santé. Chaque site indexé comprend une "notice descriptive courte" incluse dans les pages des mots clés (pour les ressources indexées au mot clé majeur), ainsi qu'une "notice descriptive longue" (exemple : http://doccismef.chu-rouen.fr/html/nl/09/009780.html).


Le "type de ressource" [Darmoni99] est une généralisation des types de publication de Medline. Nous y avons ajouté des types caractéristiques des ressources présentes sur l'Internet : association, information pour le patient, réseau coordonné, etc... Ce champ "type de ressources" fait l'objet d'un développement particulier à CISMeF, rejoignant en ceci le camp des structuralistes du projet Dublin Core, par opposition aux "minimalistes" qui préconisent un type de ressources par trop réducteur à nos yeux. Nous estimons nécessaire, en effet, de pouvoir distinguer cours, QCM (Questions à Choix Multiples), APP (Apprentissage Par Problèmes), d'une ressource textuelle quelconque.
Le type de ressource ne doit pas être confondu avec le mot clé. Par exemple, une conférence de consensus sur l'hépatite C sera indexée au mot clé hépatite c avec comme type de ressource table ronde consensus. Par contre un article traitant de la méthodologie des conférences de consensus sera indexé au mot clé table ronde consensus avec article de périodique comme type de ressource. Certains termes sont tantôt un mot-clé décrivant le sujet (exemple département anesthésie hôpital), tantôt un type de ressources, utilisé comme répertoire (exemple répertoire des départements hospitaliers d'anesthésie). 

Enfin, depuis 2002, pour qualifier la qualité de l'information, nous utilisons le langage HIDDEL dans le cadre du projet européen MedCIRCLE (http://www.medcircle.org/). Les 270 principaux sites éditeurs qui produisent des documents de qualité seront évalués (120 le sont déjà). Le but de ce projet est l'interopérabilité entre les institutions participantes, basée sur un échange de fichiers au format RDF (Resource Description Framework). Un logo MedCIRCLE sera attaché à chacune des notices CISMeF correspondant à ces sites éditeurs : CISMeF devient donc un tiers de confiance explicite.

 

3.5. Structure du catalogue, classification

CISMeF contient un classement thématique, incluant les principales spécialités biologiques et médicales reconnues en France, un classement alphabétique, tous deux inspirés du thésaurus de Medline et un accès par type de ressources.

Méta-terme
Les méta-termes correspondent à des spécialités biologiques ou médicales concernées par un ou plusieurs mots clés (ou arborescences de mots clés), qualificatifs, ou types de ressources [Thirion 99]. Par exemple pour le terme cancérologie, on trouve d'abord les sites généraux consacrés à la spécialité puis les arborescences, mots clés et qualificatifs du thesaurus MeSH concernant cette spécialité : antinéoplasiques (arb), marqueur biologique tumeur (arb), oncologie médicale (arb), secondaire (qualificatif), service oncologie hôpital (MeSH), service oncologie hôpital (type de ressource), tumeurs (arb). D'autres termes bénéficient également de cette structure, lorsque leur thématique le justifie, exemple enseignement et éducation.

A l'intérieur de ces arborescences, chaque mot clé correspond à une page, par exemple, infection hospitalière. Chaque page est organisée à l'aide des qualificatifs hiérarchisés puis, au sein de ceux-ci, à l'aide des types de ressources.

CISMeF est donc structuré en 4 niveaux hiérarchiques :

méta-terme

mot-clé

qualificatif

type de ressources


Le classement alphabétique utilise les termes MeSH en français de la traduction effectuée par l’INSERM, et indique également les termes américains (indiqués entre crochets), ce qui permet une recherche bilingue. A ce jour, nous avons indexé des ressources correspondant à 10 627 mot-clés, soit environ 48% du thesaurus MeSH (version 2004). Nous entreprenons progressivement la traduction des définitions ("scope note") du thesaurus.
L'utilisation du MeSH en français de l'INSERM nous permet de maintenir une cohérence quant au choix des termes retenus. La consultation de l’arborescence du thesaurus américain en ligne [http://www.nlm.nih.gov/mesh/MBrowser.html] nous permet de déterminer si le mot clé appartient à une ou plusieurs catégories. Ainsi le mot clé "alcoolisme" doit-il être répertorié à la fois dans les arborescences "troubles liés environnement" et "troubles mentaux". Dans CISMeF, nous développons les arborescences dans l'ordre alphabétique français, avec les accents. Il est, en effet, indispensable de pouvoir naviguer dans les arborescences afin d'élargir ou au contraire affiner une recherche par mots clés. Une navigation "dynamique" est possible en cliquant sur l'icône et permet de visualiser en un seul clic l'ensemble des

arborescences auxquelles le mot-clé appartient.

Cette organisation des données est assez délicate à manipuler, mais offre l’avantage d’allier logique et cohérence. Elle permet en effet d'établir trois classements proches de ceux du MeSH : arborescence (tree) [ par exemple, maladies virales ], alphabétique et permuté. Ce dernier est consultable par le moteur. 

Enfin, il est aussi possible d'accéder directement aux types de ressources, lorsque celles-ci font l'objet d'un répertoire particulier, exemple faculté de médecine.

Dans la terminologie CISMeF, outre les mots clés et les qualificatifs qui décrivent le sujet de la ressource, les types de ressources concernent la nature des informations véhiculées. Ce concept s'applique à la ressource dans sa globalité et il est impossible, jusqu'à présent, d'appliquer un type de ressource à une partie de document. Il n'est pas possible d'utiliser les types de ressources pour spécifier un aspect particulier d'un mot clé ou d'un couple mot clé / qualificatif.

L'objectif est de pouvoir faire une recherche plus précise permettant de trouver, par exemple, des images d'une pathologie particulière. Jusqu'à présent, la pathologie était représentée par une indexation par mots clés, et le type de la ressource concernait la ressource dans sa globalité, en ne tenant pas compte de la présence du type d'images dans le document. Le but est donc d'obtenir davantage de précision lors de l'indexation et de la recherche d'information, en permettant la recherche d'images par leur contenu.

Cette idée nous a été apportée par l'existence d'un troisième sujet de thèse (de Filip Florea) qui a débuté en novembre 2003 dans l'équipe CISMeF, concernant l'indexation bimodale texte-image.

91 types de ressources correspondant à des images médicales ont d'abord été créés. Cette liste est en partie dérivée de l'arborescence du mot clé MeSH diagnostic par imagerie, et elle a été revue et mise à jour par un expert en imagerie médicale (le Pr Jean-François Dacher). L'utilisation de cette nouvelle liste de types de ressources pour l'indexation de documents médicaux contenant des images, permet de rendre le processus d'indexation plus précis. Ainsi, par exemple, une ressource pédagogique concernant la lithiase cholédocienne et contenant des images échographiques de cette pathologie sera indexée avec le mot clé lithiase cholédocienne et les types de ressources échographie et matériel enseignement. Et, si elle contient un paragraphe décrivant l'échographie de la lithiase cholédocienne, la ressource sera indexée avec le mot clé lithiase cholédocienne auquel le qualificatif échographie sera affilié (soit le couple lithiase cholédocienne / échographie) ainsi que le type de ressource matériel enseignement.

La lacune de ce système est que les types de ressources se trouvent toujours être "flottants", c'est-à-dire qu'ils concernent l'ensemble des mots clés choisis pour l'indexation d'une ressource, un même document pouvant concerner plusieurs pathologies différentes, et donc être indexé avec des mots clés très divers. Par exemple, un cours est indexé aux mots clés cardiomyopathie hypertrophique, cardiopathie congestive et cardiomyopathie restrictive et aux types de ressource radiographie et matériel enseignement. Le type de ressource radiographie a été choisi parce que la ressource contient une image concernant la cardiopathie hypertrophique. Lors d'une recherche, un utilisateur peut vouloir trouver une ressource présentant une radiographie de la cardiopathie congestive et formuler la requête booléenne suivante : "cardiopathie congestive.mc AND radiographie.tr" qui renverra notre ressource précédemment décrite alors que l'image contenue concerne la cardiopathie hypertrophique.

Pour affiner la procédure d'indexation et de recherche d'information, l'idéal est de pouvoir associer un type de ressource à un mot clé ou à un couple mot clé / qualificatif, pour ainsi composer un triplet mot clé / qualificatif \ type de ressource. Ainsi, une ressource contenant des images radiographiques de la cardiopathie congestive sera indexée avec le couple cardiopathie congestive / diagnostic. Si l'image permet le diagnostic de la cardiopathie congestive, la ressource sera indexée avec le triplet cardiopathie congestive / diagnostic \ radiographie. Seul un nombre de types de ressource spécifiques peuvent être affiliés à un mot clé ou un couple mot clé / qualificatif.

Cette extension du couple mot clé / qualificatif au triplet mot clé / qualificatif \ type de ressource améliore le processus de recherche d'information. La requête de forme "(mot clé / qualificatif) AND type de ressource" est moins pertinente qu'une requête de forme "mot clé / qualificatif \ type de ressource".

Il faut, malgré tout, pouvoir traiter l'ambiguïté de certaines requêtes. Ainsi, un utilisateur formule, en langage naturel (par le formulaire de recherche simple de Doc'CISMeF), une requête de la façon suivante : diagnostic de la lithiase cholédocienne par échographie. Il est impossible à ce stade de savoir si l'utilisateur souhaite un texte expliquant l'échographie dans le but du diagnostic de la lithiase cholédocienne, ou une image échographique permettant le diagnostic de la lithiase cholédocienne. Dans le doute, pour l'instant, les résultats proposés englobent pour l'instant une union des deux, à savoir les textes explicatifs sur la technique d'imagerie ainsi que les images elles-mêmes.

4. Résultats

CISMeF est efficace pour retrouver des ressources francophones de qualité dans la santé. Sur un échantillon représentatif de 600 ressources (sites et documents), 70%  proviennent de France, 16 % du Canada, et en particulier du Québec, 4% de Suisse et de Belgique, et 3% d'Afrique.

Ce site Web est principalement et initialement dévolu au professionnel de santé, bien que le grand-public puisse y accéder. Beaucoup de ressources intéressent les deux publics. Toutes les pages de CISMeF sont en libre accès et gratuites. Ainsi, nos "utilisateurs" sont non seulement des professionnels de santé, mais aussi des patients, leurs familles et le grand public [Thirion99]. Nous jugeons qu'une formation à CISMeF devient indispensable pour utiliser toutes ses fonctionnalités, notamment son modèle de structuration de l'information à 4 niveaux. Deux sessions de formation ont été effectuées en février 1999 pour une association de patients (URAPEI).

CISMeF a trois axes principaux : (a) la médecine factuelle, (b) l'enseignement, et (c) l'information aux patients. Nous recensons également :

  1. hôpitaux, centre de soins et cliniques,

  2. institutions,

  3. affaires sociales,

  4. bibliothèques médicales,

  5. journaux électroniques, 

  6. bases de données et bibliographies,

  7. éditeurs médicaux,

  8. associations (de professionnels et de patients).

Depuis février 1995, plusieurs nouvelles fonctionnalités ont été ajoutées pour faciliter la recherche d'informations : une rubrique "Quoi de neuf" pour visualiser rapidement les nouveautés sur le site, en particulier les nouveaux sites référencés, et un outil de recherche Doc'CISMeF. Un guide d'utilisation est disponible en ligne. CISMeF est accessible par le dénominateur le plus commun de la technologie Internet.

4.1. Statistiques d'utilisation de CISMeF

Un des rôles fondamentaux du maître-toile est de mesurer avec précision le site dont il est responsable, en choisissant des critères reproductibles. Nous en avons identifié deux principaux dans le Net Scoring : par unité de temps, il faut mesurer le nombre de pages HTML lues et le nombre de machines, en excluant les machines du site. Mais d’autres critères doivent être étudiés, selon la structuration du site. Par exemple, pour les sites dynamiques, le critère "Nombre de pages HTML lues" doit être remplacé par le critère "Nombre de requêtes".

Le nombre de machines qui visitent le site par unité de temps est un critère utilisé pour tenter de mesurer le nombre de personnes qui consultent le site. Étant donné qu'il est difficile (y compris sur le plan éthique) de récupérer le courriel de la personne visitant le site, on utilise plus communément l'adresse IP des machines. Ce critère a le mérite d'être plus anonyme que le précédent. Si deux personnes utilisent la même machine, ce critère ne mesure qu’une seule machine. Du fait de la prolifération des machines "proxy", il existe une sous-estimation du nombre de personnes utilisant le site, autrement dit une sous-estimation du trafic engendré par la consultation du site, mais elle est la même pour tous les sites. Ainsi, pour tous les centres hospitaliers qui possèdent un proxy, la conséquence en termes statistiques est qu’une seule machine est identifiée au lieu de N.

Le second critère retenu est le nombre de documents visualisés dans la même unité de temps. Ce chiffre permet également de quantifier le trafic engendré par la consultation du site. Par "document", on entend "document HTML" ou "document PDF" (Portable Document Format), en éliminant notamment les fichiers image (au format GIF, JPEG, BMP ou d'autres) qui font généralement augmenter de manière exagérée ce nombre de documents. Les Anglo-saxons utilisent le terme non spécifique de "hits" qui incluent tous les fichiers, c’est-à-dire les documents qu’ils soient au format HTML ou PDF ainsi que tous les fichiers image, quel que soit leur format. Néanmoins, en cas de banques d'images, il est important que le maître-toile ait une vision exacte des statistiques sur les fichiers images, car ces images portent en tant que tel une valeur informationnelle.

Pour le site Web du CHU de Rouen, en mars 2000, environ 15.000 machines différentes (après exclusion des machines provenant du CHU) ont visité notre site chaque jour ouvré. Pour tenter d’estimer le nombre de personnes à partir du nombre de machines, nous avons pris comme option (paramétrage du logiciel de statistiques) qu’une machine restant connecté plus d’1/2 heure sur notre site génère une " session " supplémentaire. C’est le nombre de " sessions " qui nous permet d’estimer le nombre de personnes visitant notre site. En mars 2000, le nombre de " sessions " représentant par extrapolation le nombre de personnes se connectant sur notre site, est d’environ 20.000 par jour ouvré. Nous utilisons avec parcimonie le concept de " hits ", qui recouvrent indifféremment tous les fichiers chargés au cours d’une visite de site. Pour en savoir plus, voir ici.

Conformément au Net Scoring, nous utilisons le Web Impact Factor (WIF) qui est le nombre de sites ayant au moins un hyper-lien vers le site du maître-toile [Ingwersen98], pour quantifier indirectement l’impact d’un site. Le WIF du site du CHU de Rouen est de plus de 800 sites, (après exclusion des sites personnels), dont certains sites-catalogue prestigieux [voir http://www.chu-rouen.fr/dsii/html/pointeur.html]. Une autre façon de quantifier l’impact d’un site est d’utiliser un moteur de recherche pour connaître le WIF, non plus en terme de sites, mais en terme de page. Nous utilisons sur Alta-Vista la requête générique suivante qui élimine les hyper-liens internes : +link:nom-de-domaine.code-pays –url:nom-de-domaine.code-pays, soit pour le CHU de Rouen, +link:chu-rouen.fr –url:chu-rouen.fr. Nous définissons ainsi le WIF absolu. Celui du CHU de Rouen est de 7.987. Le WIF relatif est un ratio entre le WIF absolu et le nombre de pages du site étudié présent dans le moteur de recherche. Sa formules est (+link:nom-de-domaine.code-pays –url:nom-de-domaine.code-pays)/+url:nom-de-domaine.code-pays. Le WIF relatif du CHU de Rouen est : 7.987/5.551 soit 1,44.

Alta-Vista indique plus de 2.800 pages qui pointent sur notre site.

Le maître-toile doit effectuer régulièrement une revue de presse, toujours pour mesurer l’impact de son site. Plus de 140 citations sont parues dans la presse au sujet du site rouennais. De plus, nous avons relevé quatre études successives du CESIM (Centre d’Etudes sur le Support de l’Information Médicale) en mars 1998, octobre 1998,  mars 1999 et janvier 2000 qui ont montré que le site Web du CHU est le plus utilisé par les médecins généralistes français, représentant respectivement 10, 17,7 et 11,5% des sites utilisés pour les trois premiers, et en second pour début 2000 avec 2,9%. Le baromètre Sethos-Pharmaceutiques, en février 2003, a permis de constater que le site du CHU de Rouen est le quatrième site le plus consulté par les médecins généralistes (et troisième site institutionnel) avec 20 % d'audience (étude réalisée auprès de 401 médecins généralistes internautes). En revanche, une étude parallèle du CESIM en mars 1999 auprès des médecins spécialistes français plaçait le CHU de Rouen en 11ème position avec 2,4% des suffrages. Il a également été considéré comme le meilleur site français par un sondage du Quotidien du Médecin en 1997. En octobre 2000, l'étude FORMELL sur "l'Apport de l'informatique dans la pratique médicale" réalisée sur un échantillon de 2 462 médecins ayant terminé l'enquête, signale 200 bases de données citées par les médecins. Dans l'ordre : CHU Rouen, Medline, CHU Rennes, Vidal, ANAES, CNOM.
Dernier élément pour mesurer quantitativement un site, nous avons inclus dans le nôtre la liste des publications scientifiques produites par les équipes du site à son propos [voir http://www.chu-rouen.fr/general/pubweb.html].

D'une manière plus générale, les statistiques d'utilisation permettent une gestion affinée d'un site, en connaissant notamment l'origine géographique des visiteurs, et les documents qu'ils visualisent le plus. Sur le site du CHU de Rouen, seulement 34,61% des machines sont en provenance de France (mais 43% des sessions, et 57% des hits), 23,48% des Etats-Unis (ou identifiées comme telles car se terminant par .com, .net, .org, .edu, et .gov), 8,03% du Canada, 3,33% de la Belgique, 2,50% de la Suisse et malheureusement seulement 0,29% en provenance de 14 pays du continent africain ; la localisation géographique des machines connectées à notre site n'a pu être déterminée dans 24,05% des cas (adresse IP sans nom de domaine). Parmi l'ensemble des machines connectées au site Web du CHU de Rouen, nous avons détecté en novembre 1999 10,63 % d’abonnés de Wanadoo, 7,77 % d'AOL, et 3,36 % de Club-Internet ; enfin, 2,3 % des utilisateurs de notre site Web utilisent un modem-câble.

Le maître-toile doit étudier le rapport coût/efficacité des documents présents sur le site. Il doit notamment tenir compte des pages les plus vues, qui doivent être encore plus irréprochables par rapport au Net Scoring. Nous listons dans le tableau 2 les principales pages visualisées de notre site. Le succès de certaines pages peut rester sans explication : ainsi, nous n’en avons trouvé aucune concernant le nombre de visiteurs toujours croissant de la page Bibliothèque du CHU. En revanche, il doit se poser la question de la nécessité de maintenir sur le site des pages très chronophages en terme de gestion, comme par exemple la page WIF, surtout si on la compare à la requête Alta-Vista qui ne nécessite pas de maintenance.

Enfin, le maître-toile doit surveiller quelques éléments plus techniques concernant la place disque voire le trafic engendré sur le réseau interne de sa structure. Ainsi, le site Web du CHU de Rouen contenait ainsi, en mai 1999, 4287 fichiers (2869 HTML, 1159 GIF et 258 JPG) et 62,3 Mo d'espace disque. Le trafic engendré sur le réseau du CHU de Rouen par les différents protocoles de l’Internet, essentiellement smtp et http, ne représentent suivant les jours que 0,3 à 1,5% de la charge réseau (en moyenne quotidienne), ce que nous avons considéré comme négligeable.

Le maître-toile doit également vérifier régulièrement la validité des hyper-liens de son site. Le site du CHU de Rouen contenant 13.605 hyper-liens (dont 3.687 hyper-liens internes), nous lançons tous les trois mois une vérification globale de tous nos hyper-liens avec le logiciel Linkbot Pro 5.

5. Discussion

L'Internet facilite la communication entre professionnels de santé et avec le grand public. Il améliore également l'accès à l'information et à la connaissance pour ces deux publics. Nous distinguons plusieurs types de services pour retrouver l'information de santé sur l'Internet :

OMNI et MedWebPlus utilisent le thésaurus UMLS. OMNI, HON et CliniWeb ont également développé une base de données structurée de leurs ressources (HTML dynamique), ce qui permet de meilleures recherches, notamment pour l'utilisateur expérimenté. Cette fonction a été mise en ligne en juin 2000, avec la création de Doc'CISMeF.

Il est difficile, spécialement pour les étudiants, les patients et le grand-public d'évaluer la qualité de l'information des ressources de santé disponibles sur l'Internet, qui n'ont pas été dans la plupart des cas soumis à un comité de pairs. C'est pourquoi nous avons dévelopé une approche spécifique pour les patients, leur famille et le grand public : CISMeF-patients.

Le principal objectif de CISMeF est de promouvoir les bonnes pratiques médicales et l'enseignement des professionnels de santé et l'éducation sanitaire du grand public, en permettant l'accès aux ressources de qualité dans ces domaines. C'est pourquoi nous recensons en priorité les ressources traitant de médecine factuelle, d'enseignement pour les professionnels de santé et d'information pour les patients et le grand-public. Nous avons récemment proposé que l'indication du niveau de preuve devienne le critère de qualité du contenu médical sur l'Internet, en cas d'information 'sensible' [Darmoni01].

6. Justification

CISMeF permet dès aujourd’hui de démocratiser l'accès des professionnels de santé mais aussi des patients aux inforoutes francophones de la santé. Orienté en priorité pour les professionnels de santé, CISMeF est de plus en plus utilisé par les patients et leurs familles voire le grand-public. De nombreux sites sont dévolus aux deux publics (professionnels de santé d'une part, patient, familles et grand-public d'autre part). Nous avons organisé lors du premier trimestre 1999 nos premières sessions de formation à CISMeF pour les associations de patients (URAPEI).

L'organisation de CISMeF autorise aussi la découverte " par hasard " de sites voisins. Ainsi, lors d’une recherche sur l’hémiplégie, peut-on découvrir l’existence de sites sur la paraplégie (relation de proximité) et, plus généralement, en remontant dans l’arborescence, sur la paralysie (relation de hiérarchie). De même, le renvoi d’orientation " voir aussi " (par exemple " voir aussi les soins palliatifs " sur une page consacrée à la douleur) nous semble très délicat à manier pour un algorithme, même sophistiqué ! Ces renvois sont le fruit d’une réflexion et non d’un calcul statistique. C’est cette même réflexion qui permet de leur donner un sens (une direction). Ainsi la réciprocité n’est pas toujours de mise. S’il est justifié de faire un renvoi de la douleur vers les soins palliatifs et la bioéthique, le renvoi de la bioéthique vers la douleur ne doit pas être systématique.

CISMeF étant aujourd’hui le " site-catalogue " de référence dans la santé francophone, il contribue au développement de l’aire d'éducation, de formation et de recherche, en recensant notamment les sites francophones traitant des ces trois domaines connexes. Par nature, CISMeF participe à la circulation des contenus francophones, en établissant une vigie des sites et documents francophones dans la santé. Ainsi, CISMeF contribue à la valorisation et à l’utilisation du patrimoine francophone dans la santé. CISMeF affirme également la présence du français et de la France sur l'Internet. Ainsi, il permet des échanges d’informations entre les acteurs de la communauté francophone des six continents, grâce à la naissance du septième, le cyber-espace.

Les nouvelles technologies de l'information rendent possible l'accès à la connaissance et le partage des progrès scientifiques à un coût extrêmement faible, ce qui a comme conséquence de désenclaver les pays en développement en les associant à la communauté scientifique internationale francophone.

Ces facilités leur donnent la possibilité de confronter leurs connaissances et de valoriser leurs travaux en les rendant accessibles au plus grand nombre. CISMeF est de plus un outil important de diffusion de la formation continue des professionnels de santé. Au total, CISMeF participe à l’optimisation des pratiques de soin.

Pour des raisons de protection juridique (un certain nombre de sites Web effectuant du "Web-pillage" de notre site), les 2 maîtres-toile (administrateurs du site) du CHU de Rouen, et responsables du projet CISMeF, ont, avec l'accord du Directeur Général du CHU, publié les ouvrages "Annuaire de l'Internet médical francophone" [Darmoni97] et "Internet Médical professionnel" [Cassagne2000]. Une des raisons du succès de notre site pourrait résulter de la synergie entre les deux maîtres-toile qui sont tous les deux des professionnels de l'information (1 médecin informaticien, 1 bibliothécaire) ayant néanmoins une vision différente sur celle-ci [Braude94, Braude95]. 

Dans le cadre de la procédure "Autoroutes de l'Information", CISMeF a obtenu en mars 1998 le label "Expérimentation d'Intérêt Public" par le Comité Interministériel des Autoroutes et Services de l'Information. Depuis novembre 1998, CISMeF fait partie des actions prioritaires financées par l'Agence Universitaire de la Francophonie (AUF) dans le cadre du programme de l'Université Virtuelle Francophone (UVF). Pour les ressources concernant l'enseignement, une collaboration a été instituée avec la commission pédagogique de la Conférence Internationale des Doyens de facultés de Médecine d'Expression Française (CIDMEF) [Denef99]. Dans le cadre du programme Educnet , Doc'CISMeF a obtenu en juin 2000 un financement par le Ministère de la recherche. Stéfan Darmoni et Benoit Thirion, coordinateurs du projet CISMeF, ont obtenu pour ce travail le titre de Lauréats de l'Académie nationale de médecine par l'attribution du prix Albert Sézary en octobre 2000. CISMeF a obtenu le prix des jeudis de l'ATICA aux Electrophées 2003 dans la catégorie "Réutilisation des données et XML".

Voir la liste des partenaires.

7. Perspectives

Nous nous proposons d'enrichir le projet CISMeF en développant quatre nouveaux modules :

  1. l’extension de CISMeF vers les pays du Sud (Tunisie et Burkina-Faso pour l'Afrique et Vietnam pour l'Asie) dans le cadre du programme Université Virtuelle Francophone, financé par l'Agence Universitaire de la Francophonie.

  2. la création d'un outil de recherche interrogeant une base de données de sites de qualité, selon la définition de la médecine factuelle ("evidence-based medicine"). Cette base de données sera interrogeable par mots-clés issus pour la plupart du thésaurus de Medline. La création de cette base permettra d’effectuer des recherches plus sophistiquées pour connaître par exemple :

    1. les conférences de consensus en parasitologie,

    2. les recommandations pour bonne pratique clinique en pathologie tropicale

    3. les instructions aux auteurs des revues de langue française en neurologie.

    Cet outil de recherche a vu le jour en juin 2000 : Doc'CISMeF. Pour en savoir plus, un à propos, et une aide en ligne.

  3. la maintenance d'un référentiel de critères de qualité de l'information de santé sur l'Internet : le Net Scoring, en collaboration avec Centrale Santé et APUI-Santé. Une étape supplémentaire serait la "certification" des sites médicaux francophones. Cette grille pourrait constituer un élément constitutif de cette certification, afin d'informer au mieux le "cyber-médecin". Elle peut également aider les acteurs d'Afrique et d'Asie à l'auto-évaluation et la réalisation par les pays du Sud de sites Web conformes aux critères de qualités internationaux.

  4. l'accès à CISMeF aux patients et à leurs familles. Un guide d'utilisation a été écrit pour cette catégorie d'utilisateurs néophytes. Nous prévoyons d'aller plus loin en permettant l'accès simplifié à une information de qualité, que CISMeF se doit de fournir aux patients et leurs familles.

CISMeF est un des éléments majeurs du projet plus global Internet/Intranet au CHU de Rouen, qui s'étendra dans les prochaines années, autour de 3 axes :

(a) la diffusion d'informations de santé dans le cadre du développement de l'Université Médicale Virtuelle (UMV) et de la Bibliothèque Electronique de Rouen (Faculté-CHU) avec des prolongements régionaux, nationaux, européens et francophones. Le CHU et la Faculté de médecine de Rouen font partie du consortium de sept facultés de médecine (Grenoble, Lille, Marseille, Nancy, Paris, Rennes, et Rouen) financés par le Ministères de l’Education Nationale, de la Recherche et de la Technologie pour créer une Université Médicale Virtuelle Française (UMVF). [URL : http://www.umvf.pd.fr/].
Nous disposons depuis 1997 de l'accès en Intranet à Medline et à 45 revues biomédicales anglophones prestigieuses en texte intégral [Darmoni98], depuis décembre 1999, à des informations de médecine factuelle (2 revues, ACP Journal Club et Evidence Based Medicine, et les travaux de la collaboration Cochrane) et depuis février 2001 à plus de 400 journaux électroniques de l'éditeur Springer via le consortium COUPERIN. Nous planifions d'étendre la bibliothèque virtuelle en donnant accès à des livres et encyclopédies électroniques (par exemple, le Harrison sur l'Internet). Notre projet d'Université Virtuelle de Rouen s’inscrit dans le projet national d’UMV dont l’objectif est de développer des outils fondés sur les nouvelles technologies pour les étudiants et les enseignants : intégration de la gestion informatique de la connaissance dans le projet pédagogique.

(b) la communication (depuis 1998, tout médecin titulaire qui le souhaite dispose d'une adresse électronique), et
(c) le système d'information hospitalier et de santé, avec éventuellement le Réseau Santé Social comme outil fédérateur (en particulier les réseaux ville-hôpital).

Références

27 septembre 2006
courriel


[Menu général] [CISMeF : menu général] [Guide d'utilisation]

 

 

Logo CHU de Rouen
Liste des abréviations des champs utilisés dans Doc'CISMeF

[CISMeF]  [Aide]

[Menu général]

Exemple de syntaxe: (douleur.mc ou morphine.mc) et (cancérologie.mt sauf adulte.tc)
  sera compris comme
  (douleur (mot clé) ou morphine (mot clé)) et (cancérologie (méta terme) sauf adulte (tous champs))

Pondération : pour restreindre un sujet à ses aspect majeurs : douleur.mc[majeur].
Explosion
: par défaut dans CISMeF, il est toutefois possible de ne pas l'utiliser : douleur.mc[nonexpl] ou douleur.mc[majeur][nonexpl]
Qualificatifs : La syntaxe doit être : douleur/diagnostic.mc. Il est possible d'utiliser les abréviations des qualificatifs : di.qu (explosion par défaut) ou di.qu[nonexpl]. Un qualificatif peut-être recherché seul, on dit alors qu'il est "flottant" : diagnostic.qu. Il est alors recherché quelque soit sa place parmi les mots clés.
Troncature
(trois possibilités : droite, gauche, les deux) : rééduc*.ti, *rééducation.ti, ou encore *réédu*.ti [attention ! contrairement à PubMed, la troncature dans CISMeF, avec explosion par défaut, est permise avec les mots clés et les qualificatifs : (*tumeur*.mc et *thérap*.qu)].
Texte intégral : le champ "plein texte" permet de lancer la recherche dans le texte intégral des documents. Il est possible de combiner ce champ avec tous les autres champs existants. L'abréviation utilisée est .pt. La recherche tous champs = .tc n'inclue pas le champ .pt.


ae

 = 

année d'études (pour étudiants)

  mc  =  mot clé = descripteurs

ap

 = 

adjacence plein texte (termes proches en texte intégral)

  mr  =  mot réservé (mt + mc + qu + tr)

at

 = 

adjacence tous champs (termes proches en tous champs)

  mt  =  méta-terme
an  =  année de publication   pa  =  pays
au  =  auteur   pt  =  plein texte = texte intégral
cb  =  cible   qu  =  qualificatif
cr  =  date de création de la notice   re  =  résumé (description)
cy  =  cycle d'études (pour étudiants)   so  =  source
dp  =  département   tc  =  tous champs
ed  =  site éditeur   ti  =  titre
fo  =  format   tr  =  type de ressource
ib  =  ISBN   tx  =  titre + mot clé + résumé
in  =  institution (de l'auteur)   ur  =  URL
is  =  ISSN   vi  =  ville
la  =  langue        

courriel
27 septembre 2006


[ Menu général] [CISMeF] [Aide]

© CHU de Rouen . Toute utilisation partielle ou totale de ce document doit mentionner la source.


exemples

 

traitement de la douleur cancéreuse chez l'enfant

Remarque : Les métatermes "mt" regroupent tous les termes MeSH concernant une discipline.

 

 

toxicité du bois pour les travailleurs

Remarque : les termes MeSH couvrant le champ de la médecine du travail et de la toxicologie sont très nombreux et très dispersés dans le MeSH. Les métatermes médecine travail et toxicologie les regroupent tous, simplifiant ainsi la recherche. Les accents sont facultatifs.

 

recommandations sur les traitements du cancer du sein

Remarque : les termes MeSH couvrant le champ de la thérapeutique sont très nombreux et très dispersés dans le MeSH. Les métatermes thérapeutique les regroupent tous, y compris les qualificatifs, simplifiant ainsi la recherche. Le terme tumeur sein peut être majeur. Les accents sont facultatifs

 

 

associations de patients en cardiologie

Remarque : les termes MeSH couvrant le champ de la cardiologie sont très nombreux et très dispersés dans le MeSH. Le métaterme cardiologie les regroupe tous, simplifiant ainsi la recherche.

 

traitement de la douleur cancéreuse chez l'enfant

Remarque : Les métatermes "mt" regroupent tous les termes MeSH concernant une discipline.