IV. RECONNAISSANCE DE LA PAROLE
ET RÉALITÉ VIRTUELLE :
DES AVANCÉES TECHNOLOGIQUES MAJEURES QUI
VONT CHANGER NOTRE VIE
DANS LES PROCHAINES ANNÉES

Comment les nouvelles technologies vont changer notre vie dans ces prochaines années ?

Comme je l'ai déjà dit à plusieurs reprises, loin de se ralentir, le rythme de la mise sur le marché de technologies va encore s'accélérer dans ces prochaines années.

Ainsi le 3 Février 1998, Digital a annoncé la mise sur le marché, pour l'Eté 1998, de sa nouvelle puce, baptisée Alpha 21264, cadencée à une fréquence de 600 mégahertz (Mhz), ce qui devrait favoriser le développement de Windows NT face à Windows 95 qui ne peut fonctionner avec des puces Alpha.

La réplique d'Intel ne devrait pas se faire attendre.

En ce début de 1998, les travaux sont suffisamment avancés dans les principaux laboratoires mondiaux et les programmes de mise sur le marché suffisamment précis pour que nous puissions, avec un taux d'erreur tolérable, prédire en quoi notre vie sera changée par les NTIC dans ces 10 prochaines années.

Tout d'abord, les spectateurs sont tellement absorbés dans les temps actuels par le duel, sans partage, qui oppose actuellement le leader du logiciel, Microsoft, aux tenants du marché Java que sont Sun, Oracle et Netscape, qu'ils ne voient pas venir une révolution technologique majeure qui devrait triompher en l'an 2000, pour l'entrée de l'homme dans le troisième millénaire.

En effet, en cette année, devraient être disponibles des micro-ordinateurs qui obéiraient totalement à la voix. La productivité du clavier et de la souris n'a que médiocrement progressé dans ces deux dernières décennies alors que, dans un même temps, tous les autres composants du micro-ordinateur, en partant du processeur pour aller jusqu'à la carte vidéo, en passant par le disque dur, la mémoire vive, la carte mère, la carte son, jusqu'au CD-ROM transformé en DVD, ont fait un bond spectaculaire.

Aussi, pour justifier des microprocesseurs cadencés à des fréquences de 600 MHz (600 millions d'instructions par seconde) qui seront commercialisés dans ces prochains mois, et des mémoires de plus en plus rapides, tous les grands constructeurs de logiciels comme de matériels vont proposer, dans deux ans au plus tard, une reconnaissance naturelle de la parole, qui aura un taux d'erreur inférieur à cinq pour mille, alors que les meilleurs logiciels actuels correspondants ont encore un taux d'erreur de cinq pour cent.

Suivront ensuite, rapidement, des systèmes très élaborés de reconnaissance de l'écriture, de vidéo conférence fluidifiée et de représentation tridimentionnelle évoluée (3D) avant l'avènement de la réalité virtuelle qui constituera une nouvelle phase majeure. Mais c'est la parfaite maîtrise de la reconnaissance de la parole qui provoquera, à mon avis, dans ces prochaines années les plus profondes mutations relationnelles entre l'Homme et la Machine.

Les études réalisées dans un grand nombre de pays montrent que l'informatique reste encore très ésotérique pour beaucoup d'utilisateurs potentiels. Aussi, quand nous arriverons devant notre ordinateur et que nous dirons " allume-toi, je vais te dicter une lettre que je vais adresser à ma grand-mère Alice " et qu'il nous suffira de parler devant notre micro-ordinateur, comme si nous conversions avec notre aïeule au téléphone, pour qu'il nous prépare la lettre sans faute avec l'enveloppe, alors, la vision que se font de l'informatique beaucoup de personnes encore aujourd'hui changera profondément.

Cette reconnaissance fiable de la parole devrait avoir trois conséquences majeures dès le début du 21 e siècle :

n première conséquence : dans le domaine du téléphone ;

n deuxième conséquence : dans les rôles respectifs du téléviseur et de l'ordinateur ;

n troisième conséquence : dans notre environnement de chaque jour, à la maison ou dans notre voiture.
La première conséquence sera certainement celle qui aura le plus de répercussions sur la compétition ouverte entre l'informatique et les télécommunications. Nous pouvons affirmer que " le téléphone filaire (RTC) sera demain à la parole ce qu'est aujourd'hui le fax à l'écrit ".

Le fax est convivial, facile d'usage, mais n'a aucune faculté de reconnaître, classer, traiter les messages qu'il transporte. Bientôt, avec l'aide du protocole TCP/IP durant nos conversations téléphoniques, un système informatique inscrira automatiquement des rendez-vous sur nos plannings, ouvrira instantanément des dossiers sur les sujets abordés, créera des fichiers de suivi, réservera des salles pour des réunions décidées, transcrira intégralement nos propos sur la mémoire de notre machine, etc.

La seule réplique que peuvent avoir les opérateurs de télécommunications face à cette montée en puissance inexorable de la reconnaissance de la parole sur les PC est de développer très rapidement le débit des boucles locales pour offrir des services équivalents en partant de serveurs locaux, le terminal téléphonique se transformant alors en Network Computer (NC) (ordinateur de réseau), loué à des prix très modiques.

Le vrai combat entre le PC et le NC ne devrait pas se dérouler uniquement entre deux acteurs majeurs de l'informatique (Microsoft et Sun) mais, essentiellement, entre les acteurs de la micro-informatique PC associés au leader du logiciel et les acteurs majeurs des télécommunications associés au leader du monde Java. Du résultat de ce combat dépendra le leadership du développement des NTIC pour ces vingt prochaines années.

De coeur, nous voudrions espérer que ce combat soit gagné par les opérateurs de télécommunications car notre opérateur national, France Télécom, occupe la quatrième place mondiale dans ce secteur si important pour la place de la France dans le paysage technologique de demain.

Mais, connaissant le fossé culturel qui persiste entre les grands opérateurs de télécommunications qui, pour les plus grands parmi eux (sauf pour de récents arrivés aux dents longues), ont occupé une situation de monopole pendant de nombreuses décennies et la réactivité des jeunes et puissantes compagnies de micro-informatique, il est à craindre pour notre pays que le combat soit gagné par le monde informatique.

Aussi, au lieu de s'attarder dans des combats d'arrière-garde pour préserver des lambeaux de leur ancien monopole, les managers des grands opérateurs mondiaux de télécommunications devraient organiser leur puissante contre-attaque de façon cohérente puisqu'ils ne sont pas concurrents sur les boucles locales. S'ils ne savent pas organiser très rapidement cette contre-offensive qui leur permettrait de conserver le vocal, qui est le coeur et le coffre-fort de leur métier, nous avons la certitude qu'ils seront pris en tenaille dès ces prochaines années entre les câblo-opérateurs qui vont retrouver une jeunesse, avec les modems Cable et le puissant monde conquérant de l'informatique.

La deuxième conséquence majeure de la reconnaissance fiable de la parole est l'accélération de la fusion qu'elle va provoquer entre le monde de la télévision et le monde du micro-ordinateur familial.

Chacun ressent que les systèmes actuels permettant d'afficher des pages Web sur le téléviseur (tels que WebTV, Netbox ou Com 1) ne sont que des systèmes transitoires bien que très intéressants. L'absence de réelles capacités de mémoire ainsi que de clavier et de souris, même s'il existe des claviers infrarouges qui sont proposés en option, sont un frein réel à la navigation sur le Web.

La reconnaissance de la parole associée au développement du modem Cable ayant pour finalité de faire disparaître le clavier et la souris devrait ouvrir un champ nouveau pour ces périphériques autorisant d'accéder à Internet sur son téléviseur du moins si par ailleurs ils savent (en local ou en déporté) acquérir de réelles capacités de mémoire.

Mais la reconnaissance de la parole devrait avoir une conséquence plus profonde encore sur les rôles qui devraient être affectés, à terme, au téléviseur et à l'ordinateur dans le cercle familial.

Comme à l'école, ce serait une grave erreur d'oublier que l'image doit remplir deux rôles bien distincts dans le foyer familial.
n Tout d'abord, un rôle collectif : une image de qualité et de grandes dimensions, soutenues par des sons fidèles et réalistes (Dolby Surround) constituera l'élément central autour duquel continuera à se réunir le cercle familial. La montée en puissance dans ces prochaines années de l'écran plat à plasma de grandes dimensions ne fera que favoriser la création de " cinéma à domicile " .

n Ensuite, une fonction individuelle : clavier et image sur le micro-ordinateur, ou plutôt sur l'écran de chacun des terminaux familiaux du réseau, devront remplir un rôle à la fois ludique, de gestion, mais essentiellement permettre d'accéder à des connaissances au travers du réseau Internet.
Chaque image sur le micro-ordinateur sera adressée, non pas à un groupe, mais à un internaute en particulier. Mais, même si elles n'ont pas la même finalité, toutes les machines générant ces images (qu'elles soient à usage collectif, comme celles du téléviseur, ou individuel, comme celles du PC ou des autres terminaux) seront interconnectées sur un " réseau informatique résidentiel " et c'est là où la reconnaissance de la parole jouera un rôle essentiel.

En effet, les minis réseaux d'entreprises exigent aujourd'hui un administrateur de réseau, tant ils sont complexes à gérer. Aussi, le développement de ces " réseaux informatiques résidentiels " ne sera imaginable que lorsque ces réseaux et ensembles informatiques familiaux pourront être administrés en langage naturel. Cette gestion globale et naturelle du réseau familial bouleversera l'économie du contenu audiovisuel et informatique.

La concurrence sera vive entre les chaînes audiovisuelles, qui verront leurs marchés captifs et de masse se réduire, donc leurs revenus publicitaires décroître (d'autant plus que le téléspectateur pourra demander à son système informatique de ne plus présenter des coupures publicitaires lors de la projection d'un film) et entre les programmes (push médias) qui lui auront été concoctés sur mesure, grâce à de nouveaux agents intelligents sur le réseau Internet.

Enfin, cette reconnaissance fiable de la parole qui va être soutenue par le développement de micros instructions Java devrait bouleverser, dans ces 10 prochaines années, notre environnement, aussi bien à la maison que dans notre voiture. La reconnaissance de la parole fera des progrès très rapides au début du siècle prochain dans notre voiture.

Déjà, la synthèse de la parole a permis des progrès notoires, surtout dans les aides à la navigation, pour rejoindre une adresse possible. La reconnaissance de la parole permettra aux systèmes d'aide à la navigation, d'aide à la sécurité, de surveillance des divers paramètres techniques, de réglage de divers systèmes audios, de téléphone de voiture, d'être totalement interactifs et permettra au conducteur de conserver l'oeil sur la route et la main sur le volant... en attendant que la conduite de nos voitures devienne entièrement automatique en urbain, et sur les axes chargés dans moins de vingt ans : c'est pour demain.

Au niveau de la sécurité des immeubles, des bureaux ou des usines, la reconnaissance de la parole fera des progrès très importants dès ces prochaines années. Les systèmes de surveillance reconnaîtront instantanément les personnes autorisées et rejetteront impitoyablement (jusqu'à déclencher le système d'alarme) toute personne non reconnue.

Des systèmes multicritères de haute sécurité (reconnaissance de la voix, reconnaissance des empreintes et reconnaissance de l'iris) protégeront les lieux particulièrement sensibles.

Les travaux conduits dans divers laboratoires particulièrement en pointe, aussi bien aux Etats-Unis, au Japon, qu'en Europe, laissent penser que la réalité virtuelle - qui n'est encore qu'à ses balbutiements- devrait devenir particulièrement réaliste et accessible à tous, dès que les processeurs cadencés à une vitesse de 1 gigabits (1 milliard d'instructions par seconde) seront accessibles à de bas coûts.

Or, des annonces majeures faites par IBM et Intel en 1997 (sur l'utilisation du cuivre dans les microprocesseurs à la place de l'aluminium et sur la capacité des mémoires rapides) laissent penser que cette fréquence du gigabits devrait être atteinte dès ces prochaines années.

Les premières applications hyper-réalistes, faisant appel à trois des sens de l'homme (la vue, l'ouïe et le toucher) seront développées dans le domaine très porteur du jeu, dans un premier temps. Mais, très rapidement, des applications professionnelles avancées permettront de créer des outils de simulation, de formation et de virtualisation de nouvelle génération.

Ce monde virtuel commencera alors à envahir notre monde réel. Notre société devra alors être très vigilante pour que les exclus les plus faibles ne se réfugient pas dans ces mondes virtuels, refusant ainsi la réalité de chaque jour.

Comme l'ont fort bien écrit, il y a quelques années, Philippe Quéau d'une part, et Howard Rheingold, d'autre part, l'arrivée de cette réalité virtuelle nous ouvrira alors de nouveaux mondes.

*

* *

Il convient de tenter d'évaluer non seulement les possibilités d'évolution de l'offre de technologies mais aussi dans quelle mesure ce mouvement a des chances ou non de correspondre aux attentes du marché : c'est tout le délicat problème de l'ajustement du " technology push " au " market pull ".

Dans certains domaines, l'offre et la demande de techniques nouvelles sont, d'ores et déjà, en phase de façon si manifeste que l'on assiste à des phénomènes de croissance véritablement explosive (téléphone mobile, raccordement à Internet).

Dans d'autres, comme la télévision interactive, des déconvenues sont possibles.

La diversification des technologies, d'un côté, l'intensification de la concurrence, de l'autre, sont sources d'incertitudes.

La montée en débit, la quête de la mobilité, l'accroissement du trafic de données au détriment de celui lié à la téléphonie vocale semblent des phénomènes inéluctables mais des questions se posent :

n Dans quelles mesures le recours à des solutions haut débit économiques et rapides (ADSL, MMDS, satellites...) peut-il retarder l'avènement de réseaux optiques à large bande ?

n Quels seront les effets sur le trafic de l'entrée d'Internet dans l'économie marchande ?

n L'exacerbation de la concurrence, dans tous les domaines, ne va-t-elle pas aboutir à fournir quasi gratuitement certains services de base à l'usager, tels que l'accès à de simples informations à partir des réseaux, voire l'utilisation des systèmes d'exploitation informatiques (faut-il payer pour se servir d'un langage ?), la compétition se déplaçant vers le terrain des prestations à valeur ajoutée.