猫道会NEKODOKAI

2026-04-25

AI活用の業——2026年カオスマップ・目的別使い分け・プロンプトの書き方

6 章 / 全 8

第六章 AI画像・音声・動画の、目的別活用

テキスト以外の、AI は、2026年現在、急速に、実用化が、進んでいる

図6 画像・音声・動画——テキストを超えた、AI の、もう一つの大陸

画像・音声・動画の、目的別AI

目的推奨AI稼ぐ/雑事
副業ブログ・noteの、アイキャッチMidjourney稼ぐ
副業の、電子書籍カバーImagen稼ぐ
プレゼン資料の、図解DALL·E稼ぐ(社内評価)
会議の、文字起こしWhisper / Gemini STT雑事消す
副業ポッドキャスト・YouTubeナレーションElevenLabs稼ぐ
学習素材の、音声化NotebookLM Audio雑事消す(通勤学習)
副業の、SNS用、短尺動画Runway / Sora稼ぐ

画像・音声・動画AIは、副業の制作労力を、桁違いに圧縮する

画像生成の、目的別使い分け

1. Midjourney——副業の、アイキャッチ・サムネ

Midjourney は、アーティスティック、スタイライズされた画像に、最も、強い。

  • note・SNS のアイキャッチ——記事の、クリック率を、決める
  • YouTube サムネ——再生数を、左右する一枚
  • 広告ビジュアル

副業で、月3〜10本の、コンテンツを、出す信者にとって、外注デザイン費の、削減効果は、月1〜5万円規模になる。

2. Imagen(Gemini統合)——電子書籍・LP

Imagen は、写真的、リアリスティックな画像に、優位である。

  • 電子書籍(KDP)の、表紙
  • LP(ランディングページ)の、メイン画像
  • 製品紹介の、模擬撮影

3. DALL·E(ChatGPT統合)——会話で修正

DALL·E は、ChatGPT の、チャットの中で、何度も、修正しながら生成できる点が、最大の強み。

プレゼン資料の、図解等、反復的な修正が、必要な、用途に、適する。社内資料の、図解品質が上がることは、間接的に、評価・昇進・年収に、効く。

画像生成の、プロンプト設計

良い画像プロンプトの、要素

  • 主体(何を、描くか)
  • 場所(屋内/屋外、空間の種類)
  • 光源(朝/昼/夕/夜)
  • スタイル(写真的/イラスト的/水彩/油絵、等)
  • 構図(寄り/引き、正面/横、俯瞰/仰角)
  • 色調(暖色/寒色、鮮やか/くすみ)
  • 技術パラメータ(アスペクト比、解像度、バージョン)

音声認識(STT)の、活用——雑事消去の、最大装置

Whisper(OpenAI) は、音声を、文字に変換するAI の、事実上の標準である。

1. 会議の、文字起こし

90分の会議録音を、5〜10分で、日本語で、文字化する。精度は、ほぼ、97%。話者分離も、ある程度、できる。

  • 無料版——OpenAI Whisper(自分のPCで、オープンソースで動かす)
  • 有料版——Otter.ai、Notta、Rimo Voice 等、月額1,500〜3,000円

2. 議事録の、自動生成

文字起こし → Claude または ChatGPT で、要約 → Notion または Confluence に、保存、の、パイプラインを、組む。

1時間の会議の、議事録作成が、従来、30〜60分 → 5分に、短縮される。1日2会議の信者で、月に20〜40時間の、雑事消去である。

3. 発想の、音声メモ

歩きながら、口頭で、アイデアを、吹き込み、Whisper で、文字化、AI で、整理、という、ワークフローが、可能。副業の、コンテンツ案を、移動時間中に、量産できる。

音声生成(TTS)の、活用

1. ElevenLabs——副業ポッドキャスト・YouTubeの、自動化

10〜30分の、自分の音声サンプルを、提供すると、自分の声の、AIクローンが、生成される。

  • ポッドキャスト——原稿を、書けば、自分の声で、ナレーション自動生成
  • YouTube ナレーション——動画用、原稿の、音声化を、半自動化
  • 音声教材(Audible/Voicy)——副業の、音声商品を、収録レス化

収録時間が、10倍速になる。副業の、音声系コンテンツが、現実的な、収益経路として、立ち上がる。

2. NotebookLM Audio Overviews——学習の、ながら化

複数のPDFを、投入すると、AI二人が、ポッドキャスト形式で、内容を、議論する音声が、自動生成される。

  • 長い技術論文を、15分の、音声で、ながら学習
  • 業界レポートを、ポッドキャストとして、通勤中に、聞く
  • 市場価値向上の、ための、知識インプットを、隙間時間に、流し込む

通勤・散歩・家事中の、ながら学習で、第三訓のための、市場価値向上が、進む。

動画生成(2026年現在の、現実的使用)

Sora、Veo、Runway は、動画生成の、主要プレイヤーである。

2026年時点の、現実

  • 5〜15秒の、短尺は、実用——SNS の、アイキャッチ、広告素材
  • 30秒以上は、物語の整合性が、取れない場合が、多い
  • 1分以上は、実験段階

実用的な、使用例

  • 副業ブログの、TwitterX 投稿用、5秒ループ——フォロワーを、効率的に、増やす
  • TikTok / Reels の、最初の3秒——アルゴリズムの、突破力を、上げる
  • プレゼン資料の、アニメーション挿入——社内評価が、上がる

動画の、実用化は、2027年以降

長尺・物語性・キャラクターの一貫性を、要求する動画は、2027年〜2028年に、実用化が、見込まれる。それまでは、実写+短尺AI素材の、ハイブリッドが、現実的である。

画像・音声・動画の、法的注意

AI生成コンテンツの、著作権は、2026年4月時点で、日本では、以下の扱いである。

  • AI単独で、生成した画像・音声・動画の、著作権は、原則として、発生しない(ただし、人間の創作的寄与が、大きければ、発生)
  • ただし、他者の、著作権を、侵害する学習データ由来の、生成物は、トラブルの、可能性あり
  • 商用利用は、各AIサービスの、利用規約に従う。一部サービスは、商用利用に、追加料金

副業で、AI生成コンテンツを、販売する場合、各AIサービスの、利用規約を、必読する。Midjourney、ElevenLabs 等は、有料プラン契約で、商用利用が、明示的に、認められる場合が、多い。


AIの、能力を、一通り、見た。最後に、AI の、限界と、倫理を、確認する。

この教えを広めるX でシェア