stand.fm × AI音声副業で失敗した話 — 78日後に月2.1万円になるまでにやり直したこと【2026年版】
stand.fmでAI音声副業を始めて最初3週間で月1,200円に撃沈。失敗の原因3つと立て直しフロー(ElevenLabs+NotebookLM)を実体験レポート。月収2.1万円達成までの78日間を全公開。
※当サイトはアフィリエイトプログラムに参加しています。記事内のリンクから商品を購入すると、当サイトに報酬が支払われることがあります。詳しくはプライバシーポリシーをご覧ください。
「AIで音声コンテンツ作れば、パッシブインカム的にいけるんじゃない?」
ぶっちゃけ、3月の3連休にそんな甘いことを考えながらstand.fmのアカウントを作りました。
先に結論言うと、最初の3週間は月1,200円。時給換算したら80円くらいでした。
でも78日後の今は月2.1万〜2.8万円(波がある)で安定してきた。この記事では、なにが失敗で、どう立て直したかを全部書きます。
stand.fmで月1,200円しか稼げなかった話
3月の3連休、スタバの新作フラペチーノを飲みながら(グランデ、あっという間に冷めた)ElevenLabsで音声を作ってstand.fmに投稿した。
「AIツール × 副業」というテーマで、週3本投稿する計画を立てた。ChatGPTに台本を書かせて、ElevenLabsで音声生成して、stand.fmにアップ。作業時間は1本あたり40〜50分。
最初の2週間で7本投稿した。
再生数は1本あたり10〜30回。
収益は3週間で1,200円。
「あ、これは思ってたのと違う」と思いました(書いてて笑えてきた)。
正直、立ち上げ期の「全然稼げない」フェーズの精神的なしんどさは、AI副業でよくある失敗パターンで詳しく書いてるんですけど、音声コンテンツはその中でも特殊な失敗をしやすい。
何が悪かったのか — 3つの失敗パターン
失敗の原因は3つに整理できました。
失敗1: 「作れる」と「聴かれる」は別問題
AIで音声は作れる。でも、聴いてもらえるかどうかは全然別の話。
僕が作っていたのは「AIツールの解説コンテンツ」。テキストで読んだ方が早いし、同じテーマのYouTubeが山ほどある。
音声コンテンツが刺さるのは、「ながら聴き」できる体験設計がされているか、「この人だから聴く」というパーソナリティが伝わるかのどちらか。AIがそのまま読み上げる解説系は、正直どこにでもある。
ここ、マジで大事なんですけど、音声コンテンツはテキスト情報の劣化版じゃない。「通勤中に聴く」「ジムで聴く」という状況に刺さる体験を設計しないと、再生数が積み上がらない。
失敗2: 収益化の仕組みを理解してなかった
stand.fmは月額のstandとSPP(Partner Program)での収益化がメインで、フォロワー数と再生数が収益に直結する。
最初の1〜2ヶ月は再生数もフォロワーも少なく、SPP収益なんてほぼゼロ。ここを正しく理解していれば、最初から「アフィリエイト」「音声コンテンツ販売」「リスト収集」の3本柱で設計すべきだったんです。
AIパッシブインカムの現実チェックでも書きましたが、「プラットフォームの収益だけで稼ごう」という設計が一番最初に崩れる。
失敗3: AIボイスの質が「それなり」で終わっていた
ElevenLabsの無料プランで生成した音声、正直「ロボット感」が残る。
有料プランに上げれば相当自然になるんですが、無料プランのまま「なんかぎこちないな」と感じながら配信してた。聴いていて自然じゃない音声を最後まで聴くリスナーは少ない。
AI音声クローンビジネスの実態でも触れてますが、音声の質は離脱率に直接効きます。ここをケチったのが失敗の一つでした。
立て直した正解ルート — AI音声コンテンツの正しい作り方
失敗から4週間後に方針転換しました。立て直しのポイントは3つ:
変更1: テーマをニッチに絞った
「AIツール全般」→「AI副業で副収入月3万円以下のリアル」に絞った。
月3万円以下、というのがミソ。「月100万円!」系はフォロワー数で勝てない大手が強い。でも「月3万円以下」のリアルを話す人はあまりいない。
ぶっちゃけ、月3万円以下の段階って一番しんどくて「本当に稼げるのかな?」と疑い始める時期なんですよ。そこに刺さるコンテンツを作る、というシンプルな発想の転換でした。
ちょっと話逸れるけど、2026年のベストAI副業まとめを見てると音声コンテンツって全然注目されてないんですよね。その分、ブルーオーシャンでもある。
変更2: 収益化を最初に設計した
音声配信はあくまで「集客チャネル」として使い、実際の収益はnoteの有料コンテンツとアフィリエイトに流す設計にした。
具体的には:
- stand.fm: 週2〜3本配信(無料)→ フォロワー獲得
- note: 詳細なノウハウを有料記事(500〜2,000円)で販売 note有料コンテンツの作り方詳細はAIを使ったnote有料コンテンツ副業の始め方でまとめています。
- アフィリエイト: 配信内で紹介するツールのリンクを概要欄に設置
変更3: ElevenLabsの有料プランに課金した
月$22のCreatorプランに切り替えた。
正直、また課金かと思いましたが、音声の自然さが全然違う。聴き比べると本当に明確で、離脱率が明らかに下がった。
AIツールの予算配分の考え方でも書きましたが、「収益に直結するツール」への課金は投資であって経費。ここをケチると回り道になる。
実際の制作フロー(ElevenLabs + NotebookLM + Canvaの組み合わせ)
現在の1本あたりの制作フロー(作業時間: 約35〜45分):
Step 1: テーマ選定(5分) Xで「AI副業」「stand.fm」「副業 失敗」などを検索して「よく見るコメント・疑問」を拾う。「これって本当に?」「○○した人いる?」系のつぶやきがコンテンツのタネ。
Step 2: 台本作成(10〜15分) ChatGPTに「700〜900文字の音声台本。通勤中に聴く人向けに書いて」と指示。生成された台本を30%リライトして自分の実体験を入れる。
リサーチフェーズではNotebookLMを副業に使う方法でも紹介していますが、NotebookLMで複数の情報源を読み込んで「Q&A形式」で要約させると台本のネタ出しが早くなる。
Step 3: 音声生成(5〜10分) ElevenLabsのCreatorプランで音声生成。声はあえて少し外国人っぽい日本語ナチュラル系にして「AI副業を研究してる感」を演出している(これ、割と好評)。
Step 4: サムネイル作成(5分) Canvaのテンプレートを使って文字を変えるだけ。
Step 5: 配信・概要欄設定(5〜10分) stand.fmにアップして概要欄にnoteとアフィリエイトリンクを設置。
ここで書くのに30分くらい悩んだポイントを1つ。「AIボイスである」と明記した方が再生数が上がった。「え、全部AIが話してるんですか!?」みたいなリアクションが逆にフックになる。隠す必要は全くない。
78日目の数字公開 — 月2.1万円の内訳と今後の見通し
2026年5月1日時点(GW初日、今日書いてます)の数字:
| 収益源 | 月収 |
|---|---|
| stand.fm SPP(再生報酬) | 3,200円 |
| note有料記事 | 11,800円 |
| アフィリエイト(ツール紹介) | 6,400円 |
| 合計 | 21,400円 |
音声コンテンツと組み合わせると効果的な集客源としてAI×SNSマーケティングで副業収益を5倍にする方法も参考にどうぞ。
月によって2.1万〜2.8万くらい。正確に言うと先月が28,100円で今月は21,400円(まだ月途中なので増える予定)。
正直ここは微妙なポイント:
- SPPの収益は伸びが遅い。フォロワーが少ないと上がりにくい
- note有料記事は「たまたまXでバズった記事の波がある」ので安定しない
控えめに言っても、「誰でも毎月コンスタントに2万円以上」とは言えない状況。波がある。
おすすめしない人を正直に書いておくと:
- 「完全自動化で寝てる間に稼ぐ」を夢見てる人
- 継続配信(週2〜3本)を3ヶ月以上続けられる自信がない人
- 音声での語りかけに強い抵抗感がある人(AIボイスでも、台本の「語り感」は伝わる)
逆に合ってるのは、「文章より話す感じでコンテンツを作りたい」「テキスト系副業の集客チャネルを増やしたい」「ニッチテーマで継続発信できる」という人。
AI音楽生成のマネタイズとは違って、音声コンテンツ副業はスキルより継続力が問われます。3ヶ月続けられるかが分かれ目。
GW中に始めるなら今がタイミング。まとまった時間で初期コンテンツを5〜10本作り溜めしておけば、連休明けから毎日投稿スタートができる。短い動画コンテンツも並行して運用する場合はAI短動画副業 月3万円への道も参考になります。
よくある質問
Q: stand.fmとVoicy、AI副業ならどっちが向いてる?
A: 初心者はstand.fmが圧倒的に始めやすいです。Voicyはパーソナリティの審査があり、誰でも配信できるわけではありません。一方でVoicyはリスナーの質(リテラシー高め、購買力高め)が高い傾向があり、アフィリエイト単価が高いジャンルなら最終的にVoicyの方が収益化しやすいケースも。まずstand.fmでコンテンツ設計を確立してからVoicyに挑戦するのが現実的なルートです。
Q: ElevenLabsの無料プランで副業は難しい?
A: 月10分の無料枠では配信本数が増えると確実に足りなくなります。週2〜3本配信するなら有料プランが現実的。最初の1ヶ月は無料プランで「自分が継続できるか」を確認してから課金するのが賢い順序です。「月3本しか作れないのに有料プランはもったいない」という状況も普通にある。
Q: AI生成音声は著作権的に問題ない?
A: ElevenLabsの利用規約では商用利用(Creatorプラン以上)を認めています。ただし「実在の声優・有名人の声を模倣」するような使い方はNGです。生成した音声の著作権はユーザー側に帰属する形になりますが、法律は変わり続けているので最新の規約確認は必須。
Q: AI音声コンテンツと普通のポッドキャストの違いは?
A: 一番の違いは「コスト構造」です。生声での収録は機材・防音・録り直し等のコストがかかりますが、AIボイスならスクリプトを書けば数分で完成します。正直、コンテンツの内容が優れていれば音質の差はそこまで関係ないし、逆に内容が薄いとどんなに音質が良くても聴いてもらえない、という身もふたもない結論に至りました(78日間でわかったことがこれ)。
Q: 月2万円以上稼ぐまでに最低何ヶ月かかる?
A: 僕の場合、方針転換も含めると78日(約2ヶ月半)かかりました。ただし「最初から正しい設計で始めた場合」なら1ヶ月半〜2ヶ月で同水準に到達できると思っています。この記事の内容を最初から知っていれば30日は短縮できたはず。
追記(2026/05/01): GW初日に書いてます。「GW中に副業始めよう」と思ってる人、音声コンテンツはまとまった時間で初期コンテンツを作り溜めするのにちょうど良いです。週10本分のネタ出しと台本をGW中にやっておけば、連休明けから毎日投稿スタートできる。2〜3ヶ月後の自分への投資だと思って、今日の午後を使ってみてください。
追記(2026/05/13): GW明け2週目。Xのエンゲージメントが落ち着いてきましたが、stand.fmの再生数はGW前の水準に戻ってきました。「GWに聴き溜めしておいた人が連休後に続きを聴く」という動きがあるみたいで、音声コンテンツはすぐに再生数が落ちないのが面白い。5月末の月収は2.4万〜2.9万円を目標にしています。