Un constat, des paradoxes
J’ai été récemment en contact avec des organismes qui se situent clairement à la pointe de la technologie : laboratoires de recherche, établissements d’enseignement supérieur, pôles de compétitivité, agences européennes.
Ces organisations fonctionnent en réseau, échangent en permanence avec leurs usagers et partenaires des propositions, des projets, des rapports, des comptes-rendus. Elles doivent publier en continu des tableaux de bord, des synthèses, des évaluations …
On imagine la richesse des informations qu’elles brassent, richesses en idées, en projets d’avenir, en innovations potentielles. On imagine tout ce qu’un traitement automatisé de ces informations pourrait apporter.
Ces organisations fonctionnent en réseau, échangent en permanence avec leurs usagers et partenaires des propositions, des projets, des rapports, des comptes-rendus. Elles doivent publier en continu des tableaux de bord, des synthèses, des évaluations …
On imagine la richesse des informations qu’elles brassent, richesses en idées, en projets d’avenir, en innovations potentielles. On imagine tout ce qu’un traitement automatisé de ces informations pourrait apporter.
Pourtant, quand on demande à leurs dirigeants quels sont les outils informatiques qu’ils utilisent pour gérer et exploiter ce trésor, ils répondent en chœur : Excel ! Plus précisément : Excel, les courriels, les documents -Word, Excel et PowerPoint ou leurs équivalents libres- en pièces jointes, les répertoires de fichiers …
Pourquoi cette absence de systèmes d’information dans ces organismes à haute valeur ajoutée ?
On imagine le temps passé par les personnels hautement qualifiés de ces organismes à jongler entre clics, ouvertures, fermetures et copier / coller.
Et le stress qui en résulte, et qui fait qu’ils sont comme nous tous soulagés lorsque « ils ont fini leur PowerPoint pour la réunion de demain » Lequel PowerPoint sera aussitôt jeté à la corbeille car rendu obsolète par l’Excel pour le comité de pilotage de la semaine prochaine…
Dit autrement, ils ne possèdent pas le système d’information –au sens classique du terme- correspondant à leurs besoins.
Il s’agit pourtant d’organismes qui ont de l’argent, et dont les employés possèdent toutes les qualités pour exprimer leurs besoins et pour utiliser intelligemment des systèmes qui leur rendraient des services intelligents.
Alors pourquoi cette absence de systèmes d’information dans ces organismes à haute valeur ajoutée ?
Et le stress qui en résulte, et qui fait qu’ils sont comme nous tous soulagés lorsque « ils ont fini leur PowerPoint pour la réunion de demain » Lequel PowerPoint sera aussitôt jeté à la corbeille car rendu obsolète par l’Excel pour le comité de pilotage de la semaine prochaine…
Dit autrement, ils ne possèdent pas le système d’information –au sens classique du terme- correspondant à leurs besoins.
Il s’agit pourtant d’organismes qui ont de l’argent, et dont les employés possèdent toutes les qualités pour exprimer leurs besoins et pour utiliser intelligemment des systèmes qui leur rendraient des services intelligents.
Alors pourquoi cette absence de systèmes d’information dans ces organismes à haute valeur ajoutée ?
La réponse est simple : c’est parce qu’on ne sait pas les faire !
Nous disposons aujourd’hui d’outils de production de documents qui ont un débit supérieur à celui de nos outils de traitement de ces documents, écart de débit multiplié encore par les outils de diffusion des documents produits.
D’une part, nous ne savons pas faire de systèmes d’information « à l’ancienne » (expression de besoins, schémas de bases de données, description de procédures …) dans des délais suffisamment courts pour ne pas être démodés lors de leur mise en service, inadaptés à l’écosystème de l’organisation qui aura changé deux fois entretemps.
D’autre part, l’état de l’art de notre science informatique ne permet pas de comprendre automatiquement le sens des phrases de nos textes, des lignes de nos tableaux et des dessins de nos présentations. Notre science informatique ne nous permet pas de faire le lien entre un courriel que l’on vient de recevoir, qui annonce le retrait d’un partenaire d’un projet, et les tableaux Excel qui avaient budgété des montants pour ce partenaire, et le PowerPoint qui contenait son logo.
Que faire, face à ce débit de documents à haute valeur ajoutée qui ne faiblit pas ?
C’est à ce défi que s’attachent les solutions de recherche d’information exposées lors de SEARCH 2011.
Examinons d’abord les solutions à court terme, puis les perspectives à long terme.
A court terme, et dès aujourd’hui, la seule technologie qui montre une certaine efficacité consiste à ramener toute l’information d’entreprise à un seul et unique espace « plat » de documents considérés comme des textes en langage naturel, que l’on va indexer et retrouver du mieux possible, en tirant parti des moteurs de recherche développés pour l’indexation du Web.
C’est ce que l’on appelle les « Search Based Applications » (SBA).
La simplification radicale apportée par les SBA provoque certes un appauvrissement dans la finesse d’identification et de compréhension de chaque information, mais, étant la seule technologie disponible pour accéder de manière unifiée à des informations autrement prisonnières d’une multitude de systèmes incompatibles, c’est « ça ou rien ».
C’est la pire des solutions à l’exception de toutes les autres !
Sa force est telle que cela conduit tout naturellement –si l’on ose dire, tellement c’est contraire à leur essence- à voir les contenus structurés des bases de données de production carrément transformés en textes pour être rendues comestibles par le moteur central. Mais comme ceci permet souvent d’améliorer de plusieurs ordres de grandeur leur temps d’accès, on n’est plus très regardant.
Examinons d’abord les solutions à court terme, puis les perspectives à long terme.
A court terme, et dès aujourd’hui, la seule technologie qui montre une certaine efficacité consiste à ramener toute l’information d’entreprise à un seul et unique espace « plat » de documents considérés comme des textes en langage naturel, que l’on va indexer et retrouver du mieux possible, en tirant parti des moteurs de recherche développés pour l’indexation du Web.
C’est ce que l’on appelle les « Search Based Applications » (SBA).
La simplification radicale apportée par les SBA provoque certes un appauvrissement dans la finesse d’identification et de compréhension de chaque information, mais, étant la seule technologie disponible pour accéder de manière unifiée à des informations autrement prisonnières d’une multitude de systèmes incompatibles, c’est « ça ou rien ».
C’est la pire des solutions à l’exception de toutes les autres !
Sa force est telle que cela conduit tout naturellement –si l’on ose dire, tellement c’est contraire à leur essence- à voir les contenus structurés des bases de données de production carrément transformés en textes pour être rendues comestibles par le moteur central. Mais comme ceci permet souvent d’améliorer de plusieurs ordres de grandeur leur temps d’accès, on n’est plus très regardant.
« mal structuré / mal traité » mais tellement accessible
On va donc développer de moins en moins de systèmes d’information à l’ancienne, et leur proportion va devenir très minoritaire face au flot du « mal structuré / mal traité » mais tellement accessible.
Et d’importants investissements vont être consacrés à trouver de nouveaux moyens de faire de la « rétrosémantique », de faire émerger, de « cristalliser » du sens du fond du chaudron de soupe d’information textualisée dans laquelle on a converti toutes les données de l’entreprise.
Et d’importants investissements vont être consacrés à trouver de nouveaux moyens de faire de la « rétrosémantique », de faire émerger, de « cristalliser » du sens du fond du chaudron de soupe d’information textualisée dans laquelle on a converti toutes les données de l’entreprise.
Les exposés de SEARCH 2011 donneront plusieurs exemples des progrès actuels dans cette amélioration des processus de « cristallisation » de la soupe primitive.
Chronique d'une mort annoncée, ou de plusieurs ...
Finalement, l’abondance d’information issue des documents est en train de tuer les systèmes d’information, et de tuer les bases de données structurées.
Quelle sera la limite de cette approche, quelle sera la prochaine étape ?
Je pense qu’après la disparition des systèmes d’information et des bases de données, nous allons assister, de gré ou de force, à la disparition des documents.
Mais ceci est une autre histoire, que je tente d’explorer à travers la notion de « Calcul littéraire » ou « Litteratus Calculus ».
Pour en savoir plus, allez chercher dans la soupe !
Quelle sera la limite de cette approche, quelle sera la prochaine étape ?
Je pense qu’après la disparition des systèmes d’information et des bases de données, nous allons assister, de gré ou de force, à la disparition des documents.
Mais ceci est une autre histoire, que je tente d’explorer à travers la notion de « Calcul littéraire » ou « Litteratus Calculus ».
Pour en savoir plus, allez chercher dans la soupe !