mercredi 12 décembre 2007 - par La Pension Hamilton

Sous le web, la mine d’or : prends ta pelle !

L’épopée de la conquête spatiale, la construction européenne, les révoltés de la Bounty 150 ans après, les années de plomb en Italie, des analyses du 21 avril 2002, les écrivains et le foot... Toutes ces informations passionnantes se trouvent partagées sur le web, gratuitement. Encore faut-il les trouver.

Pour tous les passionnés de sciences humaines et sociales qui cherchent des informations élaborées et sûres, à savoir pas seulement des commentaires de commentaires ni de rapides articles sur Wikipédia, mais des travaux de seconde voire de première main (articles, thèses, mémoires) ; voici quelques sites des plus utiles.

Rechercher et trouver des informations étoffées sur le web est une stratégie. Comment en effet faire le départ des milliers voire des millions de réponses renvoyées par un moteur de recherche qui en plus n’est capable d’indexer qu’une petite partie du contenu du web ? Comment accéder aux informations présentes dans des bases de données éparses sans connaître lesdites bases ? Outre les annuaires de sites, il existe aujourd’hui un procédé bien plus performant et efficace appelé OAI (Open Archive Initiative) qui a pour but de diffuser très largement les publications du monde de la recherche, d’où cette idée d’archive « ouverte ».

Sans entrer dans des détails trop techniques, ce protocole permet à une base de données (appelée entrepôt) d’être « moissonnée » par une autre (appelée agrégateur) dont la vocation est de rassembler des ressources numériques. Ainsi trouvera-t-on en un seul endroit le contenu de plusieurs entrepôts différents et pourra-t-on y lancer des recherches. Le meilleur exemple en la matière est celui d’OAIster (Université du Michigan) qui regroupe plusieurs millions de documents électroniques (texte, image, audio, vidéo) provenant de près d’un millier de sources de tous les pays : bases d’images, catalogues de bibliothèques, revues en ligne... Bien évidemment, ces sources sont majoritairement en anglais. En France, c’est in-extenso qui joue ce rôle en regroupant des articles présents dans plusieurs dépôts OAI (dont Cyberthèses de l’Université Lyon 2) et en indexant plus de 2 millions de pages du web en sciences humaines et sociales [1].

Pour rester sur le domaine français et entrer un peu dans la matière d’in-extenso, signalons entre autres l’excellent portail de revues dénommé PERSEE. Lancé en 2003 à l’initiative du ministère de l’Education nationale, de l’Enseignement supérieur et de la Recherche, ce portail a pour but de donner libre accès aux articles d’une quarantaine de revues que leur publication ait encore lieu ou non. Que ceux à qui le mot de recherche font peur se rassurent : on trouve de tout sur PERSEE, y compris des articles accessibles sans autre pré-requis qu’une bonne culture générale.

C’est une mine ! Compte tenu de la diversité des revues disponibles, les sujets abordés sont multiples : les conséquences de la guerre en Irak, le conflit israélo-palestinien, les Beatles et la culture pop en Angleterre dans les années 60, l’évolution du recours à l’avortement en France, la série télévisée américaine Urgences, etc. Dans l’effervescence informationnelle ambiante, PERSEE et surtout le portail in-extenso constituent un excellent moyen de dépasser l’actualité, de prendre le temps de revenir un peu en arrière, d’acquérir de solides repères sur des sujets plus difficiles à appréhender et de faire le point sur les grands événements du XXe siècle. On y trouve aussi des textes étonnants tels celui sur le "Caf’ conc’ et l’hystérie" ou cet article du sociologue Philippe Bourgois qui a pris des risques non négligeables afin d’observer les pratiques et comportements des habitués d’une shooting gallery (l’endroit où se retrouvent les consommateurs de crack et d’héroïne) dans le Harlem des années 80. Il suffirait de faire un exercice très simple : prendre la une d’un grand quotidien ou d’Agoravox, en identifier les grands thèmes et interroger in-extenso. La mise en perspective s’avérera très certainement fructueuse.

Ce n’est pas comme le journal du matin ou cette fameuse « messe » de 20 heures, cela demande un peu plus d’effort, mais ces lectures font beaucoup de bien.

[1] Pour les sciences dures, se reporter au serveur HAL (Hyper Article en Ligne). Plus de 50 000 documents en ligne.



5 réactions


  • tvargentine.com lerma 12 décembre 2007 09:16

    Merci de vos infos mais quel est le type d’indexation exactement mis en oeuvre et quelle type de base de données sont utilisées ?

    Merci encore


  • Internaute Internaute 12 décembre 2007 11:42

    Merci pour l’information.

    Les moteurs de recherches pourraient se limiter à donner une dizaine de réponses car ce qui vient aprés n’a souvent plus aucun rapport avec ce que l’on cherche.

    Personnellement je trouve que le Web manque de sites ditactiques comme peut l’être une bibliothèque universitaire avec ses livres de cours et d’exercices. On trouve beaucoup d’articles qui sont des commentaires sur tel ou tel sujet mais dés qu’on recherche quelque-chose de précis cela devient difficile.


  • Tzecoatl Tzecoatl 12 décembre 2007 12:24

    Sympa comme article, aller décrypter en globish scientifique sur arxiv.org pour les sciences pures n’est pas une synécure.


  • Eric Lombard Eric Lombard 15 décembre 2007 10:46

    Pour les publications scientifiques, il y a aussi Google scholar : http://scholar.google.com/


  • Marsupilami Marsupilami 15 décembre 2007 17:29

    @ L’auteur

    Très intéressante information, merci. Et très bonne et drôle illustration de pelleteuse excavatrice, bravo !


Réagir