はじめに

Fish Audioが提供する先進的なAI音声技術へようこそ。私たちは「何を言うか」と同じくらい「どう言うか」が重要だと考えています。合成される音声を単に「リアル」にするだけでなく、「心に響く」ものにするため、リアルタイム感情・声調制御マーカーシステムを導入しました。

このシステムはFish Audio S1の中核部分であり、音声に感情を注入し、話す速度や声調を精密に制御することができます。本ガイドは、これらのマーカーの使用方法、関連ルール、ベストプラクティスを総合的に紹介し、あなたの創造性を表現豊かな音声作品として形にするお手伝いをいたします。

1. 基本的な使用法:マーカー構文

すべての制御マーカーは括弧 () で囲む必要があります。この構文は共通です。

基本形式: (マーカー)読み上げるテキスト

適用範囲: 一つのマーカーは、新しいマーカーが現れるまで、その後のすべてのテキストに影響します。日本語のマーカー配置ルールは他の言語よりも柔軟です。詳細は以下をご覧ください。

2. マーカーの分類とルール

マーカーは3つの主要カテゴリに分かれています:感情マーカー、声調マーカー、特殊マーカー。

2.1 感情マーカー

感情マーカーは文や句の感情的な基調を設定します。

ルール: 日本語では、感情マーカーを文の最初または途中に配置することができ、表現により大きな柔軟性を提供します。

例:

  • 文頭での使用:(怒り)どうしてこんな仕打ちをするんだ?
  • 文中での使用:あなたをこんなに信頼していたのに、(怒り)どうしてこんな仕打ちをするんだ?

利用可能なマーカーの種類:

1. 感情マーカー(必ず最初に1つだけ):

(不機嫌な口調) (不満) (怒り) (威嚇) (落ち込む) (緊張した口調) (怯える) (慌てた口調) (心配) (残念) (疑惑) (驚く) (感心) (誇張) (命令) (説教) (自信満々) (気楽) (真剣) (懇願) (軽蔑) (嘲り) (脅し) (挑発) (嫌がる) (真誠) (自慢) (困惑) (説得) (傲慢) (悲しい) (感動) (悩む) (困る) (自責) (後悔) (気まずい) (失望) (絶望) (恥じる) (不安) (焦る) (羨ましい) (妬む) (興味深い) (尊敬) (感嘆) (同情) (感謝) (関心) (認め) (理解) (思いやり) (満足) (幸せ) (喜び) (興奮) (欣快) (恥ずかしい) (信頼) (意外) (平和) (平静) (平然) (照れる) (優しい) (イライラする) (懐かしい) (からかう) (厳粛)

2.2 声調制御マーカー

これらのマーカーは文中のどこにでも配置でき、音声の伝達方法を調整します。

2. 声調マーカー(文中どこでも可):

  • (明るい声):明るく前向きな雰囲気を作るために使用。

    • 例: 今日はいい天気ですね!(明るい声)お散歩でもいかがですか?
  • (大声で):叫び声や特に強調が必要な場面をシミュレート。

    • 例: (大声で)おーい!聞こえますか?
  • (激昂の口調):激しい感情の爆発を表現。

    • 例: もう我慢できない!(激昂の口調)いい加減にしろ!
  • (力込む):力強い、決意に満ちた表現。

    • 例: 絶対に諦めない!(力込む)最後まで戦い抜く!
  • (激しい口調):強烈で情熱的な表現。

    • 例: この問題は重要だ!(激しい口調)見過ごすわけにはいかない!
  • (声が潤む):感情で声が震える様子。

    • 例: ありがとう...(声が潤む)本当にありがとう。
  • (声が震えて):恐怖や感動で声が震える。

    • 例: 信じられない...(声が震えて)夢みたいだ。

2.3 特殊マーカー

これらのマーカーは非言語的な音をシミュレートし、文中のどこにでも配置できます。一部は対応する擬音語を必須で後に続ける必要があります。

3. 特殊マーカー(文中どこでも可):

  • (泣きながら):泣きながら話すことを表現。

    • 例: もう...(泣きながら)しくしく...だめだよ。
  • (泣き声):悲しい泣き声を表現。

    • 例: 彼女は顔を覆って、(泣き声)くすんくすん、もう何も言えなかった。
  • (ちょっと泣いた):軽い涙を表現。

    • 例: 少し感動して、(ちょっと泣いた)ひっく...ひっく。
  • (大泣き):激しく泣くことを表現。

    • 例: 子供は慰められることなく、(大泣き)わーんわーん!
  • (笑いながら):笑いながら話すことを表現。

    • 例: そのジョークを聞いて、(笑いながら)ガハハッ、もう我慢できない!
  • (笑い声):心からの笑い声を表現。

    • 例: みんなで一緒に(笑い声)ハハハ、楽しい時間だった。
  • (ちょっと笑った):軽い笑いを表現。

    • 例: それはちょっと面白いね、(ちょっと笑った)えへへ。
  • (悲鳴):恐怖や驚きの叫び声。

    • 例: 突然現れた影に、(悲鳴)きゃあ!
  • (溜め息):失望、無力感、疲労を表現。

    • 例: どうしてこんなことに...(溜め息)はあ〜。

3. 高度な使用法と組み合わせ例

異なるマーカーを組み合わせることで、層のある動的な音声効果を作り出すことができます。

日本語の例(柔軟性の実演):

(怒り)よくも私を裏切ったな!(激昂の口調)こんなに信頼していたのに、(大声で)どうしてこんな仕打ちをするんだ?

4. 重要な注意事項とベストプラクティス

  1. ルールを厳密に守る: 日本語ルールは柔軟ですが、感情マーカーを感情単位の最初に配置することで、通常最も明確な効果が得られます。

  2. 標準マーカーを優先使用: 上記リストの公式マーカーは最高の精度を持っています。

  3. 記述的マーカーの慎重な使用: (悲しくて静かな声で)のような複雑なマーカーの作成を避けてください。モデルはコマンドを実行するのではなく、直接読み上げる可能性があります。代わりに(悲しい)(声が潤む)のように標準マーカーを組み合わせて使用してください。

  4. マーカーの過度な使用を避ける: 短い文中で多すぎるマーカーを使用すると、モデルが混乱する可能性があります。目的を持って使用してください。

  5. 既知の問題への注意: 一部の擬音語(特に笑い声や泣き声)の発音が時々不自然に聞こえることがあります。これは我々が積極的に改善に取り組んでいる既知の問題です。