2026-04-25
AI活用の業——2026年カオスマップ・目的別使い分け・プロンプトの書き方
第 6 章 / 全 8 章
第六章 AI画像・音声・動画の、目的別活用
テキスト以外の、AI は、2026年現在、急速に、実用化が、進んでいる。
◆ 画像・音声・動画の、目的別AI ◆
| 目的 | 推奨AI | 稼ぐ/雑事 |
|---|---|---|
| 副業ブログ・noteの、アイキャッチ | Midjourney | 稼ぐ |
| 副業の、電子書籍カバー | Imagen | 稼ぐ |
| プレゼン資料の、図解 | DALL·E | 稼ぐ(社内評価) |
| 会議の、文字起こし | Whisper / Gemini STT | 雑事消す |
| 副業ポッドキャスト・YouTubeナレーション | ElevenLabs | 稼ぐ |
| 学習素材の、音声化 | NotebookLM Audio | 雑事消す(通勤学習) |
| 副業の、SNS用、短尺動画 | Runway / Sora | 稼ぐ |
画像・音声・動画AIは、副業の制作労力を、桁違いに圧縮する
画像生成の、目的別使い分け
1. Midjourney——副業の、アイキャッチ・サムネ
Midjourney は、アーティスティック、スタイライズされた画像に、最も、強い。
- note・SNS のアイキャッチ——記事の、クリック率を、決める
- YouTube サムネ——再生数を、左右する一枚
- 広告ビジュアル
副業で、月3〜10本の、コンテンツを、出す信者にとって、外注デザイン費の、削減効果は、月1〜5万円規模になる。
2. Imagen(Gemini統合)——電子書籍・LP
Imagen は、写真的、リアリスティックな画像に、優位である。
- 電子書籍(KDP)の、表紙
- LP(ランディングページ)の、メイン画像
- 製品紹介の、模擬撮影
3. DALL·E(ChatGPT統合)——会話で修正
DALL·E は、ChatGPT の、チャットの中で、何度も、修正しながら生成できる点が、最大の強み。
プレゼン資料の、図解等、反復的な修正が、必要な、用途に、適する。社内資料の、図解品質が上がることは、間接的に、評価・昇進・年収に、効く。
画像生成の、プロンプト設計
良い画像プロンプトの、要素:
- 主体(何を、描くか)
- 場所(屋内/屋外、空間の種類)
- 光源(朝/昼/夕/夜)
- スタイル(写真的/イラスト的/水彩/油絵、等)
- 構図(寄り/引き、正面/横、俯瞰/仰角)
- 色調(暖色/寒色、鮮やか/くすみ)
- 技術パラメータ(アスペクト比、解像度、バージョン)
音声認識(STT)の、活用——雑事消去の、最大装置
Whisper(OpenAI) は、音声を、文字に変換するAI の、事実上の標準である。
1. 会議の、文字起こし
90分の会議録音を、5〜10分で、日本語で、文字化する。精度は、ほぼ、97%。話者分離も、ある程度、できる。
- 無料版——OpenAI Whisper(自分のPCで、オープンソースで動かす)
- 有料版——Otter.ai、Notta、Rimo Voice 等、月額1,500〜3,000円
2. 議事録の、自動生成
文字起こし → Claude または ChatGPT で、要約 → Notion または Confluence に、保存、の、パイプラインを、組む。
1時間の会議の、議事録作成が、従来、30〜60分 → 5分に、短縮される。1日2会議の信者で、月に20〜40時間の、雑事消去である。
3. 発想の、音声メモ
歩きながら、口頭で、アイデアを、吹き込み、Whisper で、文字化、AI で、整理、という、ワークフローが、可能。副業の、コンテンツ案を、移動時間中に、量産できる。
音声生成(TTS)の、活用
1. ElevenLabs——副業ポッドキャスト・YouTubeの、自動化
10〜30分の、自分の音声サンプルを、提供すると、自分の声の、AIクローンが、生成される。
- ポッドキャスト——原稿を、書けば、自分の声で、ナレーション自動生成
- YouTube ナレーション——動画用、原稿の、音声化を、半自動化
- 音声教材(Audible/Voicy)——副業の、音声商品を、収録レス化
収録時間が、10倍速になる。副業の、音声系コンテンツが、現実的な、収益経路として、立ち上がる。
2. NotebookLM Audio Overviews——学習の、ながら化
複数のPDFを、投入すると、AI二人が、ポッドキャスト形式で、内容を、議論する音声が、自動生成される。
- 長い技術論文を、15分の、音声で、ながら学習
- 業界レポートを、ポッドキャストとして、通勤中に、聞く
- 市場価値向上の、ための、知識インプットを、隙間時間に、流し込む
通勤・散歩・家事中の、ながら学習で、第三訓のための、市場価値向上が、進む。
動画生成(2026年現在の、現実的使用)
Sora、Veo、Runway は、動画生成の、主要プレイヤーである。
2026年時点の、現実
- 5〜15秒の、短尺は、実用——SNS の、アイキャッチ、広告素材
- 30秒以上は、物語の整合性が、取れない場合が、多い
- 1分以上は、実験段階
実用的な、使用例
- 副業ブログの、TwitterX 投稿用、5秒ループ——フォロワーを、効率的に、増やす
- TikTok / Reels の、最初の3秒——アルゴリズムの、突破力を、上げる
- プレゼン資料の、アニメーション挿入——社内評価が、上がる
動画の、実用化は、2027年以降
長尺・物語性・キャラクターの一貫性を、要求する動画は、2027年〜2028年に、実用化が、見込まれる。それまでは、実写+短尺AI素材の、ハイブリッドが、現実的である。
画像・音声・動画の、法的注意
AI生成コンテンツの、著作権は、2026年4月時点で、日本では、以下の扱いである。
- AI単独で、生成した画像・音声・動画の、著作権は、原則として、発生しない(ただし、人間の創作的寄与が、大きければ、発生)
- ただし、他者の、著作権を、侵害する学習データ由来の、生成物は、トラブルの、可能性あり
- 商用利用は、各AIサービスの、利用規約に従う。一部サービスは、商用利用に、追加料金
副業で、AI生成コンテンツを、販売する場合、各AIサービスの、利用規約を、必読する。Midjourney、ElevenLabs 等は、有料プラン契約で、商用利用が、明示的に、認められる場合が、多い。
AIの、能力を、一通り、見た。最後に、AI の、限界と、倫理を、確認する。