書き起こすスピードを10倍にする裏技

書き起こし(テープ起こし)は、単に「聴いて打つ」だけの作業ではありません。再生環境の整え方、表記ルールの決め方、ケバ取りや整文の判断基準など、品質とスピードを左右するポイントがいくつもあります。このページでは、2011年から書き起こし専門メディアとして活動してきた編集部が、実務で使えるテクニックを工程順にまとめました。これから書き起こしを始める方にも、すでに作業している方の見直しにも役立つはずです。そもそも書き起こしとは何か、という基本から知りたい方は書き起こし(文字起こし)とは?のページをご覧ください。

聴き取り精度を上げる再生環境づくり

書き起こしの効率は、タイピング速度よりも「聴き直しの回数をどれだけ減らせるか」で決まります。まず整えるべきは再生環境です。

  • 再生速度の調整:聴き取りやすい音源は1.2〜1.5倍速で一気に進め、早口の話者や雑音の多い箇所は0.7〜0.8倍速に落とす、というメリハリが基本です。常に等速で聴くより、トータルの作業時間は大きく短縮できます。ただし遅くしすぎると音がこもって逆に聴き取りにくくなるため、0.5倍速以下は最後の手段と考えましょう。
  • 区間リピート:聴き取れない箇所は、数秒の区間を繰り返し再生できる機能を使います。「3秒戻る」ショートカットを多用するより、問題の区間だけをループさせたほうが集中して聴き分けられます。同じ箇所を5回聴いて分からなければいったん「●●(不明)」と印を付けて先へ進み、後でまとめて再挑戦するのが鉄則です。文脈が頭に入った後のほうが、不思議と聴き取れることが多いものです。
  • ヘッドホン・イヤホンの使用:スピーカー再生よりも細部の聴き分けが格段に楽になります。密閉型のヘッドホンであれば、小声や語尾の聴き落としを減らせます。
  • キーボードから手を離さない:再生・停止・巻き戻しをショートカットキーやフットペダルで操作できるようにすると、マウス操作の往復が消え、作業のリズムが途切れません。

作業前の「下準備」で精度が決まる

再生環境と並んで効果が大きいのが、聴き始める前の下準備です。おすすめは、本格的な作業に入る前に音源全体を流し聞きするか、少なくとも冒頭と要所を拾い聞きしておくことです。話者の人数と声の特徴、話題の流れ、頻出する専門用語をあらかじめ把握しておくと、一文ごとの聴き取りで迷う時間が激減します。インタビューであれば質問項目のリスト、講演であれば配布資料に先に目を通しておくのも同じ効果があります。また、長時間音源は30分〜1時間程度のブロックに区切り、ブロックごとに「起こす→ざっと見直す」を繰り返すほうが、最後にまとめて見直すより集中力を保ちやすく、ミスの混入も防げます。

表記統一ルールの作り方

長い音源や複数人での分担作業では、表記ゆれが品質を大きく損ないます。作業を始める前に、最低限次の項目を決めた「表記ルール表」を作っておきましょう。

  1. 数字の表記:算用数字か漢数字か(例:「3つ」か「三つ」か)。桁区切りやパーセントの書き方もここで決めます。
  2. ひらく・とじるの基準:「事」と「こと」、「下さい」と「ください」、「致します」と「いたします」など、頻出語の漢字・かなを統一します。
  3. カタカナ語・英字:「サーバ」か「サーバー」か、「Web」か「ウェブ」か。納品先に既存の表記基準があれば必ず確認します。
  4. 記号の使い方:聴取不能箇所は「(●●)」、笑いは「(笑)」、沈黙は「(沈黙)」など、注記記号を先に定義しておくと迷いがなくなります。
  5. 話者表記:フルネームか、姓のみか、「A氏・B氏」か。敬称の有無も統一します。

ルール表は一度作れば次の案件でも流用できます。作業中に迷った語はその都度ルール表に追記していくと、自分専用の用字用語集に育っていきます。

ケバ取りの判断基準

ケバ取りとは、意味を持たない言いよどみや口癖を取り除く処理です。難しいのは「どこまで取るか」の線引きで、次のような基準で考えると判断が安定します。

  • 原則として取るもの:「あのー」「えっと」「まあ」「なんか」などの場つなぎ表現、「うんうん」「はいはい」といった聞き手の単純な相づち、同じ語の無意味な繰り返し(「それは、それはですね」→「それはですね」)。
  • 残すべきケース:同じ「あのー」でも、質問に対して長く考え込んでから発せられた「あのー……それは難しい質問ですね」のような言いよどみは、ためらいというニュアンス自体に意味があります。発言の心情が読み取れる言いよどみは残す、単なる口癖は取る、が基本線です。
  • 相づちの例外:「はい」が単なる相づちではなく質問への回答(同意)になっている場合は、削除すると意味が変わってしまいます。前後の文脈で機能を見極めましょう。

迷ったら「削除しても発言の意味とニュアンスが変わらないか」を自問するのが、最もシンプルで確実な判断方法です。

整文の度合いの決め方

整文は話し言葉を書き言葉に整える処理ですが、強くかけるほど話者らしさは失われます。用途から逆算して度合いを決めましょう。

整文の度合い処理の内容向いている用途
軽め語尾の「〜で、〜で」の連続を句点で区切る、明らかな言い間違いを直す程度講演録、議事録
中程度倒置や挿入の多い文を語順から整理し、文単位で読みやすくする会報・冊子への掲載
強め重複する内容の整理や接続詞の補いまで行い、読み物として完成させる書籍・Web記事の原稿

注意したいのは、整文はあくまで「表現を整える」処理であって、発言内容の追加や削除は越権だということです。話者が言っていないことを書き足してしまえば、それはもう書き起こしではありません。

固有名詞の確認方法

人名・社名・地名・専門用語の誤りは、書き起こしの信頼性を最も損なうミスです。次の手順で確認しましょう。

  1. 資料を先に読む:講演資料・議事次第・参加者名簿など、音源に関連する資料があれば作業前に目を通します。登場しそうな固有名詞を先に把握しておくだけで、聴き取りの精度が変わります。
  2. 公式情報で裏を取る:人名は所属組織の公式サイト、社名は企業の公式表記(「株式会社」の前後位置まで)を確認します。検索結果の上位というだけで判断せず、一次情報にあたるのが原則です。
  3. 同音異義に注意:「カワサキ」が川崎か川﨑か河崎か、音だけでは判別できません。確認が取れない場合は無理に当て字をせず、カタカナ表記に注記を添えて納品時に申し送りします。

納品前の品質チェックリスト

仕上げの確認は、観点を分けて行うと漏れが減ります。納品前に最低限チェックしたい項目です。

  • 不明箇所(●●)の数を最終確認し、再挑戦して潰せるものは潰したか
  • 話者の取り違えがないか(特に声質の似た話者の切り替わり部分)
  • 表記ルール表との不一致がないか(検索・置換機能で機械的に確認)
  • 数字・日付・金額を音源と再照合したか(誤りの影響が大きい項目)
  • 固有名詞の裏取りが済んでいるか、未確認のものに申し送りを付けたか
  • タイムスタンプの指定がある場合、間隔と形式が指示どおりか
  • 冒頭と末尾の数分を再度聴き直したか(集中力の影響でミスが出やすい箇所)

AI文字起こしを併用するときの校正ポイント

近年はAI文字起こしツールで下書きを作り、人間が校正する進め方が一般的になりました。ツールの選び方はAI文字起こしツール比較で詳しく紹介していますが、併用時の校正には独特の注意点があります。

  • 「読めてしまう誤変換」を疑う:AIの誤りは、文として自然に読めてしまう同音異義の誤変換が中心です。目視だけでは見抜けないため、必ず音源を聴きながら照合します。
  • 話者の重なりと固有名詞は重点確認:複数人が同時に話した箇所と、一般的でない固有名詞は、AIが特に苦手とする部分です。ここだけは等速以下でじっくり聴き直しましょう。
  • 「抜け」を見逃さない:AIは聴き取れなかった箇所を黙って飛ばすことがあります。誤りの修正だけに気を取られず、発言が丸ごと欠落していないかをタイムラインで確認します。
  • ケバ取り・整文は人間の仕事:ニュアンスを踏まえた残す・取るの判断や、用途に合わせた整文の度合いの調整は、依然として人間の判断が必要な領域です。AIの出力は「素起こしに近い下書き」と捉えるのが安全です。

時間がない・難しい音源はプロにお任せください

ここまでのテクニックを実践しても、雑音の多い音源や長時間の収録を自力で仕上げるのは大変な作業です。書き起こし.comでは、講演・インタビュー・会議・研究調査など幅広いジャンルの書き起こしを承っています。「この音源で対応できるか」という段階のご相談も歓迎ですので、まずはお問い合わせフォームからお気軽にご連絡ください。