Crunchez vos adresses URL
|
Rejoignez notre discord
|
Hébergez vos photos
Affichage des résultats 1 à 6 sur 6

Discussion: Text to Audio (AI)

  1. #1
    J'avais envie de faire d'un epub en ma possession un livre audio.

    Je n'ai pas regardé les solutions payantes, et du côté gratuit je suis tombé sur https://github.com/DrewThomasson/ebook2audiobook.

    Malheureusement, c'est très imparfait. Il y a des artefacts audio de temps en temps, certains trucs sont mal lus (8h30 est lu "huit H trente")… Y a pas énormément de samples de voix disponibles non plus, mais on doit pouvoir en créer.

    Y a quelques options qui permettent par exemple de régler la vitesse de la voix, le maximum étant 3 mais je trouve ça encore un peu lent parfois.

    L'interface web est buggée et mal fichue, mais ça fait le boulot.

    J'avais l'idée de tabler sur l'IA pour mettre le texte en audio en me disant que prendre le contexte de phrases entières ou de groupes de phrases pourrait faire des intonations bien plus naturelles qu'un synthétiseur vocal "normal", mais ça n'est pas assez le cas pour le moment, du moins pas avec ce logiciel.

    Si vous connaissez des logiciels qui pourraient faire le boulot, je suis preneur !

    J'ai essayé Google's Play Books (pas d'IA), mais la synthèse vocale est très médiocre, du moins en français.
    Un thème sombre pour le forum : ça se passe ici.

  2. #2
    Je cherche la même chose mais je t'avoue je n'ai rien trouvé qui me convienne donc si des canards ont des suggestions je suis preneurs

  3. #3
    Ça n'existe pas pour le moment tout du moins pas vraiment pour le particulier.

    Il existe de quoi faire quelques phrases avec un résultat plus ou moins bon (en tout cas en anglais) mais pas pour faire un livre (hormis de petite nouvelles).

  4. #4
    En payant il y a https://platform.openai.com/docs/guides/text-to-speech

    15$ pour un million de caractères (30 pour la version HD, à voir les différences).

  5. #5
    https://d.canapin.dev/uploads/defaul...f273ebc9c6.mp3

    25 secondes du chapitre 2 de Seuls dans l'univers de Jean-Pierre Bibring avec ebook2audiobook, réglages par défaut hormi la vitesse de narration mise à 3 (1 par défaut).

    Le logiciel m'a pondu un fichier qui commence par le chapitre 2 pour une raison que j'ignore. Pour le moment c'est pas assez peaufiné je trouve.

    Il y a deux trois samples de voix qu'on peut utiliser pour remplacer la voix par défaut, mais je les trouve moins bien, le rendu est moins crédible.
    On peut pas choisir le format de sortie, ni output 1 fichier par chapitre…

    En tout cas je ne pourrais pas me contenter d'un tel rendu pour faire un livre audio, je vais attendre que ça évolue un peu (j'ai pas envie de raquer pour le moment).

    Le livre en question a au total 385000 caractères. Il m'a fallu peut-être une heure pour générer le fichier audio avec une 3080.
    Dernière modification par Coin-coin le Canapin ; 12/01/2025 à 14h54.
    Un thème sombre pour le forum : ça se passe ici.

  6. #6
    Pour la voix regarde ce que fait Microsoft avec leur voix naturelles (dispo en natif sous W11 et peut se télécharger sous W10 et aussi dispo dans Edge pour te faire une idée des voix) qui font toujours un poil artificiel mais se débrouille mieux en anglais.

Règles de messages

  • Vous ne pouvez pas créer de nouvelles discussions
  • Vous ne pouvez pas envoyer des réponses
  • Vous ne pouvez pas envoyer des pièces jointes
  • Vous ne pouvez pas modifier vos messages
  •