2026-04-25

AIツールの使い分け完全ガイド——2026年カオスマップ・目的別比較・プロンプトの書き方

第 6 章 / 全 8 章

第六章　AI画像・音声・動画の、目的別活用

テキスト以外の、AI は、2026年現在、急速に、実用化が、進んでいる。

デスクに並ぶタブレットとノートPC、それぞれの画面にAI画像生成ソフト・AI音声編集ソフト・AI動画エディタが開かれ、カラフルなインターフェースが並ぶ、机の端で信者の後ろ姿がキーボードに向かう — 図6　画像・音声・動画——テキストを超えた、AI の、もう一つの大陸

◆ 画像・音声・動画の、目的別AI ◆

目的	推奨AI	稼ぐ／雑事
副業ブログ・noteの、アイキャッチ	Midjourney	稼ぐ
副業の、電子書籍カバー	Imagen	稼ぐ
プレゼン資料の、図解	DALL·E	稼ぐ（社内評価）
会議の、文字起こし	Whisper / Gemini STT	雑事消す
副業ポッドキャスト・YouTubeナレーション	ElevenLabs	稼ぐ
学習素材の、音声化	NotebookLM Audio	雑事消す（通勤学習）
副業の、SNS用、短尺動画	Runway / Sora	稼ぐ

画像・音声・動画AIは、副業の制作労力を、桁違いに圧縮する

画像生成の、目的別使い分け

1. Midjourney——副業の、アイキャッチ・サムネ

Midjourney は、アーティスティック、スタイライズされた画像に、最も、強い。

note・SNS のアイキャッチ——記事の、クリック率を、決める
YouTube サムネ——再生数を、左右する一枚
広告ビジュアル

副業で、月3〜10本の、コンテンツを、出す信者にとって、外注デザイン費の、削減効果は、月1〜5万円規模になる。

2. Imagen（Gemini統合）——電子書籍・LP

Imagen は、写真的、リアリスティックな画像に、優位である。

電子書籍（KDP）の、表紙
LP（ランディングページ）の、メイン画像
製品紹介の、模擬撮影

3. DALL·E（ChatGPT統合）——会話で修正

DALL·E は、ChatGPT の、チャットの中で、何度も、修正しながら生成できる点が、最大の強み。

プレゼン資料の、図解等、反復的な修正が、必要な、用途に、適する。社内資料の、図解品質が上がることは、間接的に、評価・昇進・年収に、効く。

画像生成の、プロンプト設計

良い画像プロンプトの、要素：

主体（何を、描くか）
場所（屋内／屋外、空間の種類）
光源（朝／昼／夕／夜）
スタイル（写真的／イラスト的／水彩／油絵、等）
構図（寄り／引き、正面／横、俯瞰／仰角）
色調（暖色／寒色、鮮やか／くすみ）
技術パラメータ（アスペクト比、解像度、バージョン）

音声認識（STT）の、活用——雑事消去の、最大装置

Whisper（OpenAI） は、音声を、文字に変換するAI の、事実上の標準である。

1. 会議の、文字起こし

90分の会議録音を、5〜10分で、日本語で、文字化する。精度は、ほぼ、97%。話者分離も、ある程度、できる。

無料版——OpenAI Whisper（自分のPCで、オープンソースで動かす）
有料版——Otter.ai、Notta、Rimo Voice 等、月額1,500〜3,000円

2. 議事録の、自動生成

文字起こし → Claude または ChatGPT で、要約 → Notion または Confluence に、保存、の、パイプラインを、組む。

1時間の会議の、議事録作成が、従来、30〜60分 → 5分に、短縮される。1日2会議の信者で、月に20〜40時間の、雑事消去である。

3. 発想の、音声メモ

歩きながら、口頭で、アイデアを、吹き込み、Whisper で、文字化、AI で、整理、という、ワークフローが、可能。副業の、コンテンツ案を、移動時間中に、量産できる。

音声生成（TTS）の、活用

1. ElevenLabs——副業ポッドキャスト・YouTubeの、自動化

10〜30分の、自分の音声サンプルを、提供すると、自分の声の、AIクローンが、生成される。

ポッドキャスト——原稿を、書けば、自分の声で、ナレーション自動生成
YouTube ナレーション——動画用、原稿の、音声化を、半自動化
音声教材（Audible/Voicy）——副業の、音声商品を、収録レス化

収録時間が、10倍速になる。副業の、音声系コンテンツが、現実的な、収益経路として、立ち上がる。

2. NotebookLM Audio Overviews——学習の、ながら化

複数のPDFを、投入すると、AI二人が、ポッドキャスト形式で、内容を、議論する音声が、自動生成される。

長い技術論文を、15分の、音声で、ながら学習
業界レポートを、ポッドキャストとして、通勤中に、聞く
市場価値向上の、ための、知識インプットを、隙間時間に、流し込む

通勤・散歩・家事中の、ながら学習で、第三訓のための、市場価値向上が、進む。

動画生成（2026年現在の、現実的使用）

Sora、Veo、Runway は、動画生成の、主要プレイヤーである。

2026年時点の、現実

5〜15秒の、短尺は、実用——SNS の、アイキャッチ、広告素材
30秒以上は、物語の整合性が、取れない場合が、多い
1分以上は、実験段階

実用的な、使用例

副業ブログの、TwitterX 投稿用、5秒ループ——フォロワーを、効率的に、増やす
TikTok / Reels の、最初の3秒——アルゴリズムの、突破力を、上げる
プレゼン資料の、アニメーション挿入——社内評価が、上がる

動画の、実用化は、2027年以降

長尺・物語性・キャラクターの一貫性を、要求する動画は、2027年〜2028年に、実用化が、見込まれる。それまでは、実写＋短尺AI素材の、ハイブリッドが、現実的である。

画像・音声・動画の、法的注意

AI生成コンテンツの、著作権は、2026年4月時点で、日本では、以下の扱いである。

AI単独で、生成した画像・音声・動画の、著作権は、原則として、発生しない（ただし、人間の創作的寄与が、大きければ、発生）
ただし、他者の、著作権を、侵害する学習データ由来の、生成物は、トラブルの、可能性あり
商用利用は、各AIサービスの、利用規約に従う。一部サービスは、商用利用に、追加料金

副業で、AI生成コンテンツを、販売する場合、各AIサービスの、利用規約を、必読する。Midjourney、ElevenLabs 等は、有料プラン契約で、商用利用が、明示的に、認められる場合が、多い。

AIの、能力を、一通り、見た。最後に、AI の、限界と、倫理を、確認する。