Colloques en ligne

Gilles Bonnet

Qu’est-ce que le monovlogue ?

What is « Monovlogue » ?

« […] qu’est-ce que ce monologue intérieur qui prétendrait ne rendre compte que verbalement du flux mental ? N’est-ce pas au cinéma (ou au théâtre), plus qu’à la littérature, qu’il revient d’en tenter la restitution (si tant est que l’image soit pleinement adéquate à rendre compte des processus inconscients ?) »
Danan, 1995, p. 47.

« Le monologue intérieur ne trouvera son expression totale qu’avec le cinéma »
Eisenstein, 1976, cité par Danan, 1995, p. 156.

1La « littéraTube » se définit comme un corpus spécifique de capsules vidéo, présentes sur la plateforme YouTube, qui contribuent à informer une nouvelle production littéraire nativement numérique. D’abord baptisée à l’aide d’une notice présente sur le site Fabula, en 2018, elle vient de faire l’objet d’un essai à six mains (Bonnet, Fülöp & Théval, 2023). Un écosystème littéraire inédit s’y construit, peuplé d’écranvains (Bonnet, 2017) interrogeant le statut du littéraire via la mise en place de modalités neuves de publication. La littéraTube revendique une littérarité non textocentrée, qui la place au cœur des enjeux contemporains de redéfinition en acte du littéraire par la littérature numérique. Elle constitue, si l’on précise un peu le propos, un pan important de cette littérature dite contextuelle ou exposée, qui selon David Ruffel, « débord[e] le cadre du livre et le geste d’écriture » (Ruffel, 2010, p. 62). Or, un ensemble de discours audio-visuels, qui incorporent un nombre remarquable de caractéristiques stylistiques et thématiques du monologue, semblent structurer en profondeur ce corpus, en déterminant une énonciation repérable tout particulièrement dans les journaux filmés, ou vlogs, avatars des blogs des années 2000.

2Et donc :
Blog + vidéo = vlog
monologue + vlog= monovlogue

Présences en silence

3Si le dispositif premier des vidéos sur Youtube, la talking head, ne règne plus en maître sur la diversité des publications, reste que le face-caméra demeure au centre des capsules d’un François Bon2, d’un Guillaume Cingal3, ou, plus sporadiquement, d’une Milène Tournier4 :

img-1.jpgimg-2.jpg

img-3.jpg

4Entre performance et stand-up, ces vidéos proposent un dispositif simple qui souligne leur présence : c’est qu’à l’écran, le littéraTubeur, tout comme le performeur, a un corps. Pour autant, une part en expansion de la production de littéraTube tend à absenter ce corps, omniprésent dans les contenus mainstream de la plateforme (pensons par exemple aux booktubeurs ou tout simplement à la culture numérique du sketch, canal historique de la vidéo YouTube) et à explorer une voie qui se veut héritière d’une filiation littéraire textuelle venue du xixe siècle, celle du monologue intérieur tel qu’illustré par un Dujardin, puis un Valéry Larbaud dans le domaine français tout en reprenant à nouveaux frais une histoire audiovisuelle tramée de l’art vidéo d’un Nam June Paik, des vidéopoèmes chers aux avant-gardes de la fin du xxe siècle5, mais également de la vogue de la vidéo amateur de monsieur et madame tout-le-monde. La prise en compte de l’affordance, de l’énonciation éditoriale de la plateforme, des spécificités d’une poétique numérique ainsi que des usages de YouTube comme réseau social viennent retravailler cet héritage pour constituer ce que je voudrais nommer « monovlogue ».

5Dès que le corps comme origine de la parole s’absente de l’image, l’adresse se floute et c’est bien au monologue, davantage qu’au soliloque, que nous avons affaire. De très nombreuses vidéos de notre corpus montrent ainsi un goût prononcé pour l’acousmatique, ce son que l’on entend sans en percevoir la source. Dotée de pouvoirs quasi magiques (Chion, 1982, p. 26-29), la voix qui résonne sans être incarnée à l’écran déporte la parole vers le monologue intérieur, a fortiori lorsque le filmage, comme dans les journaux filmés d’un Michel Brosseau ou d’un Arnaud de la Cotte, achève d’assimiler caméra subjective et focalisation interne. En l’absence d’un narrateur externe qui assurerait les fonctions de régie, la tâche est confiée au locuteur, qui ne cesse d’interroger sa capacité à communiquer dans un tel dispositif, parfois même avec une certaine angoisse, comme chez Gracia Bejjani :

img-4.jpg

6Sur l’écran s’incrustent des syntagmes minimaux, bribes de texte en surimpression qui parfois même ne sont pas prononcées à haute voix, ni ne sont reliées à quelque acte d’écriture représenté : nous pourrions parler ici d’un texte lui aussi acousmatique. Silence du texte incrusté et effacement du locuteur concourent à inscrire l’écriture dans le cercle, heureusement brisé à chaque visionnage par le spectateur/lecteur, du monologue intérieur : chaque bribe de discours, chaque fragment de texte s’efface bientôt, comme clos sur lui-même, sans qu’aucune réponse ne puisse être formulée dans l’instant – même dans les cas de dialogisation interne du monologue, comme ici par Gracia Bejjani7 :

img-5.jpg

7C’est principalement le silence, parfois pesant, qui fait ressentir ces fragments textuels comme autant de pensées intérieures. Silence paradoxal, si souligné qu’il invite le lecteur/spectateur à imaginer une « voix narrative » sur le modèle de celle dont parlait Blanchot dans L’Entretien infini et qui se révèlerait liée à « cette impression que quelqu'un parle “par-derrière” » (Blanchot, 1969, p. 557). Loin de n’être qu’une rencontre fortuite, la proximité paradoxale entre ce discours pour soi typique de la modernité littéraire et des capsules vidéo déposées sur la plus grande plateforme de partage du Web du début du xxie siècle, creuse en réalité le même sillon de l’écriture dans son lien à une verbalisation intérieure et à une interrogation sur la communicabilité hypothétique de l’expérience littéraire. Au détour de l’une de ses capsules, Milène Tournier paraît affronter un tel questionnement8 :

img-6.jpg

Seuils

8Le corpus de littéraTube montre un goût très prononcé pour les voyages en train — ou sa variante parisienne, le RER ; ou sa variante individuelle, la voiture — comme autant d’occasions de laisser l’appareil enregistrer le défilement du paysage extérieur. Véritable stylème, ce travelling offre à la voix qui monologue un support particulièrement adéquat. Non seulement parce que la fixité de l’appareil, la constance du cadre, offrent un arrière-plan sur lequel la voix ou le texte incrusté pourront plus nettement se détacher, mais bien aussi parce que la temporalité même de l’expérience favorise et accompagne la mise au jour de cette parole intérieure. La vitre séparant le filmeur du monde extérieur se constituera, le moment venu, en écran de choix pour le texte en surimpression, ou fera rebondir la voix d’un locuteur se bouclant ouvertement sur elle-même. Dans cette vidéo de Milène Tournier, « Compostelle, matines et RER », par exemple9, le défilement régulier du paysage, scandé par ses poteaux électriques, qui à intervalles réguliers attestent de la vitesse du train, mime ainsi le déroulé de pensées à la dérive que le monologue laisse apparaître à la surface de la conscience en leur donnant corps verbal. Joseph Danan ne qualifie-t-il pas Les Lauriers sont coupés de « plus long travelling de l’histoire de la littérature » (Danan, 1995, p. 47) ?

9La vitesse du train semble refléter celle de la pensée qui doit cependant coexister avec une lenteur symétrique, l’immobilité du passager et de l’objectif en l’occurrence, pour que nous parvenions, par le monologue, poursuit Danan, à saisir ces pensées en nous : « la pensée allie la vitesse de l’éclair et une extrême patience : si quelque chose a lieu, dit [Derrida], c’est entre les deux » (Danan, 1995, p. 172). Le défilement du paysage permet au monologueur de rester attentif au dehors tout en s’en détachant suffisamment, dans une vision aussi flottante que l’écoute de bribes de phrases et pensées. Du flux paysager au flux de pensées, la rêverie s’invite, pour l’auteur, rêverie qui caractérise souvent, également, notre mode de visionnage des vidéos sur YouTube que Geer Lovink qualifie justement de « online dream trip » (Lovink & Niederer, 2008, p. 12). Quand Michel Brosseau souhaite « retrouver dehors la grammaire du rêve10 », il assigne à son journal une fonction d’extériorisation classiquement attribuée au monologue considéré comme vecteur privilégié d’expressivité. De fait, si Molly Bloom s’engouffre dans un stream of consciousness dénué de toute ponctuation, Joyce ne manque pas de préciser dans son Ulysse que c’est parce qu’elle est en proie à un endormissement, seuil donnant accès encore à la conscience et déjà à l’inconscient. Valéry Larbaud dans Amants, heureux amants, ou Dujardin dans Les lauriers sont coupés ne procèdent pas autrement. La vitre du train, comme écran à la fois opaque et transparent, matérialise cette membrane psychique en contact avec l’intérieur et l’extérieur, qui vibre de projeter une intériorité, à l’image du monologueur de L’Innommable de Beckett, incapable de se penser autrement que comme un tel seuil :

[…] c’est peut-être ça que je sens, qu’il y a un dehors et un dedans et moi au milieu, c’est peut-être ça que je suis, la chose qui divise le monde en deux, d’une part le dehors, de l’autre le dedans, ça peut être mince comme une lame, je ne suis ni d’un côté ni de l’autre, je suis au milieu, je suis la cloison, j’ai deux faces et pas d’épaisseur, c’est peut-être ça que je sens, je me sens qui vibre, je suis le tympan, d’un côté c’est le crâne, de l’autre le monde […] (Beckett, [1953] 2016, p. 158).

10Brosseau conçoit de même ses vidéos comme autant d’allers-retours de soi vers le monde extérieur : « des décors, mais aussi des espaces intérieurs ; mon œil regarde à la fois et dedans et dehors, parfois même sans toujours que je le sache11 ». L’œil de la caméra fait de même, qui invite à percevoir les espaces filmés comme pris dans cette tension. Gracia Bejjani joue de la superposition des deux images pour créer ce que nous pourrions appeler un écran de Moebius, où l’intérieur d’une rame de métro se noue à l’extérieur, et vice-versa12 :

img-7.jpg

11Or, c’est justement ce ruban de Moebius, objet lacanien, qui apparaît à plusieurs théoriciens du monologue intérieur venus après Lacan, dont Joseph Danan, comme la meilleure figuration de la communication, dès lors rendue possible, entre conscient et inconscient, entre dedans et dehors (Danan, 1995, p. 24).

Le quotidien en usages

12Le monovlogue instaure en effet une proximité avec l’auditeur qui rappelle celle à laquelle parvient au cinéma cette « voix-je » dont la matité et la neutralité, écrit Michel Chion, favoriseront l’identification du spectateur au locuteur (Chion, 1982, p. 48). Aussi s’épanouit-il dans des plans d’espaces familiers, qui reviennent comme rengaines et routines du quotidien : le point de vue d’Arnaud de la Cotte, le jardin de Michel Brosseau… L’infraordinaire perecquien se filme : il s’agit alors de filmer « ce qui ne se regarde pas, ou, ce qui ne nous regarde pas13 ». Et Brosseau de commenter : « je filme au plus près de la matière, presque à l’intérieur de la forme et de la couleur, au creux du silence de l’objet, et du monde14 ». Dès lors, le monovlogue s’impose, comme endophasie à peine contrariée puisque prononcée, qui creuse le silence de soi pour atteindre celui du réel. Dire au plus près de soi permet bien de filmer au plus près du monde et d’accorder les discours. « Rien ne se passe15 », « il ne se passe rien » : rien n’a de granularité suffisante pour être retenu par ces vidéos, hors la matière même du monde. De même que le choix du monologue intérieur a souvent été vécu par la littérature moderne comme un retour à une parole originelle et à une langue poétique primitive (Martin-Achard, 2017, p. 90), le monovlogue s’ente sur des pratiques teintées d’un certain primitivisme, à l’image de ces boules d’argile qui régulièrement hantent le journal filmé d’Arnaud de la Cotte. « Revenir à la matière », explique le filmeur, qui complète tout de suite : « revenir au souffle du vent »17 : le monovlogue serait cette parole élémentaire vouée à malaxer encore et encore cette matière première.

13C’est bien à un souci d’immédiateté que répondent et le choix du monologue d’une part, récit « émancipé de tout patronage narratif », « récit immédiat » (Genette, 1972) car débarrassé de toute interface de médiation, et la pauvreté revendiquée d’une pratique esthétique d’autre part. Loin de la culture youtubéenne d’un spectaculaire volontiers trash (Dominguez Leiva, 2014, p. 8), Milène Tournier se positionne également en marge et comme en-deçà des codes dominants. Les surfaces du monde ne se craquellent dans ses capsules vidéo qu’au prix d’un retour amont vers un regard d’enfant et une parole au plus près du sujet, qui accordent le primat à la perception.

img-8.jpg

14Le texte de Milène Tournier18 se réduit à une suite de syntagmes nominaux. Exit le verbe recteur, d’état ou d’action, ordonnant autour de lui une syntaxe en bon ordre. Ainsi s’amenuise aussi un sujet qui se découvre sur le moment inapte à régir un monde extérieur dont il se sait n’occuper aucun centre. Le texte reproduit ici la parataxe thématique du monologue intérieur déjà formalisée par Dujardin dans Les lauriers sont coupés, parataxe asyndétique objet d’un métadiscours dans le texte de 1877 : « Le vin, le jeu, — le vin, le jeu, les belles, — voilà, voilà… Quel rapport y a-t-il entre le vin et le jeu, entre le jeu et les belles ? » (Dujardin, [1887] 2001, p. 51). Inspiré par les motifs wagnériens19, le monologue intérieur de Dujardin jouait d’une parataxe mimant l’épiphanie renouvelée d’éclats sensibles du réel à la surface de la conscience, quand Milène Tournier manifeste ces mêmes épiphanies à la surface de l’écran vidéo. L’auteur de l’essai sur Le Monologue intérieur, évoquait déjà à ce sujet une « représentation cinématographique de la pensée » (Dujardin, [1887] 2001, p. 52) : le monovlogue, audio-visuel par nature, vient donner corps à cette intuition première, tout en conservant une caractéristique stylistique majeure de l’écriture du monologue intérieur chez Dujardin comme Joyce, l’inversion (« Vide est la banquette en face ») voire la dislocation, qui repousse à la fin du syntagme nominal ou de la proposition, le thème : « Illuminé, rouge, doré, le café », lit-on dans Les lauriers sont coupés (Dujardin, [1887] 2001, p. 49 et 47) ; et chez Milène Tournier :

img-9.jpg

15Le monde apparaît tamisé par les sensations et perceptions d’un sujet qui ne cesse, filmant le quotidien arraché à sa supposée insignifiance, d’interroger le sens de sa présence au sein de l’environnement que filme l’œil-caméra. Le monovlogue vient performativement déployer une parole de retrait, presqu’amuïe, qui inscrit le locuteur dans la marginalité revendiquée comme « droit de retrait du monde » par un Michel Brosseau20.

Ress-assez

16 Les journaux filmés montrent très fréquemment une préférence pour l’enregistrement de gestes répétitifs car ritualisés, qu’il s’agisse d’ouvrir le rideau électrique de la baie vitrée pour Arnaud de la Cotte, de filmer les chaises de son jardin pour Brosseau, voire de monter dans une même vidéo plusieurs fois ces plans déjà présents tant de fois ailleurs… Ces capsules vidéo confrontent ainsi l’instable d’une identité mouvante en quête d’elle-même (l’ipséité de Ricoeur, théoricien de l’identité narrative) à la constance d’un chez soi qui fait retour, nommé mêmeté (Ricoeur, 1990). À la linéarité habituelle du récit, ces capsules préfèrent donc la répétition des « petites choses » dont Bon fait le socle de son journal filmé, dans un manifeste vidéo du vlog, qu’il intitule précisément « ça change quoi, de dire pour soi21 ? ». Images et voix s’enroulent et se nouent, faisant de l’empêchement leur sujet même. Ainsi Gracia Bejjani donne-t-elle également à entendre la faille de tout discours, en montant en boucle la même hésitation d’une voix enregistrée butant sur son premier mot, « reviens », dont le sémantisme itératif dit déjà cet enroulement sur soi du monovlogue22. Loin d’une rhétorique artificiellement polie, au clinquant néo-classique, images et voix (se) cherchent dans une fragilité qui renoue avec le ressassement si cher aux grands monologues du xxe siècle, du Bavard de des Forêts à L’Innommable de Beckett. Si l’épanorthose s’impose au cœur de ces textes comme le stylème central du ressassement, les capsules vidéo de littéraTube en bâtissent un équivalent visuel en filmant un même objet, mais avec de légères variations d’angle ou de lumière. Dans « vertèbres de pluie quand l’heure se tait », Bejjani filme ainsi un ciel vide que de légers mouvements de caméra animent, appelant à des récits qui radotent ou dans « à un soupçon près », s’attarde sur des rangées de chaises dans une église, filmées selon des angles divers. Brosseau, lui, offre un plan fixe, qui s’étire, et filme l’écoulement régulier d’un mince ruisseau, dont la surface mouvante fait miroiter les galets de son lit, en un jeu subtil de nuances infimes25. C’est la moire dont Barthes fit une figure du Neutre, que rappellent de telles vidéos. Multiplier les plans permet en effet de faire briller différemment les espaces et les objets, d’en révéler ainsi les nuances, de même que la moire, proposait Barthes, est « ce qui change finement d’aspect, peut-être de sens, selon l’inclinaison du regard du sujet » (Barthes, 2002, p. 83). Or, nous dit Dominique Rabaté à la suite de Blanchot, le ressassement « prend la forme mobile et incessamment défaite d’un éternel retour du même dans sa différence, retour qui ruine les catégories du Même et de l’Autre sous le signe du “neutre” dont L’Entretien infini ne cesse de décliner les paradoxes » (Rabaté, 2002, p. 16).

17Du ciel déserté de Bejjani aux chaises vides de Brosseau, la vidéo s’enroule, spirale émotionnelle autour d’une absence centrale, « non-coïncidence originaire » (Rabaté, 2002, p. 16) qu’images et textes ou voix tentent d’approcher à chaque fois plus près par d’infimes variations de points de vue. L’image balbutie, cahotante dans « vertèbres de pluie… » comme est cahotant le vieil homme, qui ne cesse de se mettre en route sans jamais atteindre son hypothétique but26. Michel Brosseau définit lui ses capsules vidéo comme une « série d’instantanés27 », et cette sérialité doit être prise à la lettre, tant elle construit le geste même de la littéraTube, archivée sur des chaînes YouTube au sein de playlists qui exemplifient le principe anthologique de la culture numérique. Cette sérialité s’origine également dans la prégnance d’un ressassement qui sans cesse relance l’entreprise de vidéo-écriture, hantée par un doute et une négativité qui lui rendent inaccessible toute clôture, en alimentant cette culture numérique de la variation qu’illustrent tant de petites formes numériques, du GIF au mème.

18Le monovlogue déploie en effet une esthétique de la répétition-variation qui crée à proprement parler un ressassement visuel. Enregistrant les infimes variations phénoménales, la moire visuelle du monovlogue, bien mieux que la syncope stroboscopique caractéristique de l’esthétique du vidéo-clip omniprésent sur la plateforme, et contre le goût de la vidéo mainstream pour le montage cut, fait accéder le vidéonaute à la granularité fine de durées souterrainement habitées par le travail du temps à la surface des choses à chaque instant. Si le monologue, selon Mallarmé, se proposait de saisir « l’instant pris à la gorge », le monovlogue peut à son tour prétendre frayer entre des « récits d’instants » (Bejjani), lui qui a hérité certains des thèmes et des stylèmes les plus marquants du monologue et les a retravaillés pour les adapter à la nature audiovisuelle de la littéraTube.

19Enfin — et c’est là peut-être tout particulièrement que le monovlogue perpétue la tradition littéraire du monologue — tout en l’infléchissant en raison de sa nature propre, ces capsules vidéos parviennent à répondre à la gageure historiquement définitoire du monologue intérieur. Lorsqu’Édouard Dujardin publie en 1877 Les lauriers sont coupés, considéré par son ampleur comme le premier « monologue autonome » (Cohn, 1981, p. 199), et auquel Joyce se réfèrera, apparaît en effet la quadrature du cercle de tout monologue censé transcrire en direct le bouillonnement interne d’une psyché. Michel Butor notait cet embarras comme la faiblesse de toute expression monologale, et en même temps sa nécessité29 : comment représenter une simultanéité brouillonne d’affects et de pensées, dans le cadre de la phrase, prisonnière de la successivité de notre langage ? En offrant un débord du verbal, par le croisement de plusieurs systèmes sémiotiques, les vidéos de littéraTube auront relevé le défi. Dans le cadre de l’écrit seul, « une erreur », avertit Dorrit Cohn, « a été de croire que le monologue intérieur, dans les romans du courant de conscience, donne une image de la vie psychique à plusieurs niveaux de conscience simultanés » (Cohn, 1981, p. 107). Mais contre la règle étouffante de la consécution, la nature plurimédiatique de ces capsules, mêlant texte, voix, sons et images autorise une superposition de couches qui, elle, parvient à suggérer une simultanéité souvent discordante, en tout cas complexe. Les logiciels de montage utilisés matérialisent et réalisent cette simultanéité en visualisant la stratification des contenus, répartis en plusieurs couches ; cinq pistes, par exemple, pour la timeline d’OpenShot Video Editor :

img-10-small450.jpg

20Dujardin, dans Les lauriers sont coupés, ne procédait pas autrement, avec les moyens qui étaient les siens, lui qui n’hésita pas à suggérer une telle intermédialité en copiant/collant une portée musicale au sein même de son texte :

img-11.png

21Dans la vidéo de littéraTube, tous les effets d’incrustation, de surimpression et de fondu-enchaînés manifestent à l’écran cette sédimentation plurimédiatique. Elle affronte alors, et victorieusement, l’aporie si souvent subie par l’imaginaire de la profondeur psychique, cher au monologue intérieur prompt à se définir comme plongée dans l’inconscient, mais en butte à la linéarité successive de la langue. C’est par là que le monovlogue échappe à l’intenable conception centralisée d’un monologue intérieur inféodé à un « Je » recteur, « qui ramène tout à lui-même ». Puisque constitué d’une pluralité sémiotique, d’abord, et accessible ensuite dans cet espace décentré et rhizomatique qu’est Internet, le monovlogue semble apte à faire entendre et voir cette « autre parole » que Blanchot pensait pourtant inaccessible à tout discours monologuant, cette « autre parole qui n’a pas de centre, [qui] est essentiellement errante et toujours au dehors » (Blanchot, 1959, p. 270).