業務効率化・開発日誌
【アプリ開発続編】「高機能」より「適材適所」。Gemini 2.5 Flashと脱GASで実現した、身の丈に合う最強の保育園DX。
こんにちは。鹿児島市谷山中央で税理士事務所を経営しながら、すぐ近くで2つの保育園を運営している、鯵坂(あじさか)です。
さて、以前からシリーズでお届けしているわけではないものの「自作・保育園日報アプリ」の開発記。今日はその「続編(システム刷新編)」をお届けします。
前回の記事(こちら)では、GoogleスプレッドシートとAppSheetを使って「音声入力で日報を作る!」と息巻いていました。
しかし、実際に現場で運用してみると、いくつかの「壁」にぶつかりました。それは技術的な壁であり、同時にコストの壁でもありました。
結論から言うと、私は慣れ親しんだ「スプレッドシート + GAS(Google Apps Script)」という構成を捨て、「Next.js + Supabase」という、より自由度の高い環境へ移行しました。
さらに、AIモデルもそこそこ新しくかつ軽量な(コストが)「Gemini 2.5 Flash」へ切り替えました。
なぜそこまでしたのか?
「最新技術を使いたかったから」ではありません。
経営者として、「コストと成果のバランス(ROI)」を極限まで突き詰めた結果、そこに行き着いただけの話です。
今日は、あえて「最新の高額モデル(Gemini 3.0)」や「夢の会話機能(Gemini LIVE)」を選ばなかった理由と、中小企業のシステム選びにおける「適正解」について語ります。
1. 現場のリアル。「独り言は、やっぱりツラいんです」
システム移行のきっかけは、やはり現場の声でした。
初期バージョンのアプリは、スマホに向かって「今日の出来事」を一方的に喋るスタイル。機能としては成立していましたが、現場の先生からはこんな本音が漏れてきました。
「先生、機能は便利です。でも……誰もいない部屋でスマホに向かって『今日は〇〇ちゃんが…』って5分間も喋り続けるの、心が折れそうになります(苦笑)。
なんだか壁に向かって報告してるみたいで、虚しいんですよね……」
これ、経営者として見過ごせない問題です。
私の哲学は「デジタルはアナログ(熱量)を守るための手段」。効率化の過程で、働く人の「心の熱量」が冷めてしまっては本末転倒です。
「報告(独り言)」だから辛い。
なら、「会話(キャッチボール)」にすればいい。
単純ですが、これが解決策でした。
2. なぜ「Gemini LIVE」や「Gemini 3.0」を選ばなかったか?
会話型のAIを作ろうとした時、まず頭に浮かぶのはGoogleの最新技術「Gemini LIVE API」です。人間のようにリアルタイムで音声通話ができる、夢のような機能です。
あるいは、最高性能を誇るフラッグシップモデル「Gemini 3.0 Pro」を使う選択肢もありました。
しかし、私はあえてそれらを選ばず、中級モデルの「Gemini 2.5 Flash」を選びました。
その理由は、税理士としての「コスト感覚」と、デジタル日曜大工職人としての「必要十分」の判断です。
(1) Gemini LIVEは「ランニングコスト」が見合わない
リアルタイムの音声対話APIは、サーバー負荷が高く、従量課金が高額になりがちです。
保育園の日報は毎日行うもの。職員全員が毎日3分も使えば、ひと月で2万円を超える利用料になる試算です。
「日報のためだけに、そこまでコストをかけるのか?」
経営者として、答えはNOです。
(2) Gemini 3.0 Proは「オーバースペック」である
最高性能の「3.0 Pro」は確かに賢いですが、その分、利用料も高い。
今回必要なのは「複雑な論文を書くこと」ではなく、「保育士さんの話に相槌を打ち、簡単な質問を返すこと」です。
それなら、最高級の頭脳はいりません。
(3) だからこその「Gemini 2.5 Flash」
そこで白羽の矢が立ったのが、Gemini 2.5 Flashです。
このモデルの魅力は、「そこそこ賢くて、めちゃくちゃ安くて、反応が速い」こと。
日報の聞き取り役に特化させるなら、これで十分お釣りがきます。
「最新だから良い」のではなく、「用途に対して、コストと性能がジャストフィットしているから良い」。
この「身の丈に合った選定」こそが、中小企業のIT導入における鉄則です。
3. なぜGASをやめて、Next.js + Supabase にしたのか?
次にシステムの話です。
これまではGoogleスプレッドシートとGAS(Google Apps Script)で運用していましたが、今回から「Next.js」と「Supabase」という構成に刷新しました。
(※少し専門的ですが、Webアプリを作るためのモダンな道具セットだと思ってください)
GASをやめた理由は、処理速度云々よりも「柔軟性(Flexibility)」の問題が大きかったですね。
スプレッドシートは「定食」、Next.jsは「ビュッフェ」
AppSheetやGASは、用意された枠組みの中で作る「定食」のようなものです。手軽で美味しいですが、「小鉢を別のものに変えたい」「味付けを細かく調整したい」と思った時に、どうしても限界が来ます。
今回やりたかった「会話形式のUI(LINEのような見た目)」や、「AIが喋っている間に次の処理を裏で回す」といった細かい挙動を作り込むには、GASとスプレッドシートではどうしても制約が多すぎました。
「やりたいことが、ツールの制約でできない」
これはデジタル日曜大工職人として一番ストレスが溜まりますし、現場への提供価値も下がります。
対して、Next.jsとSupabaseの組み合わせは、いわば「ビュッフェ」あるいは「フルオーダーキッチン」。
データ構造も、画面の動きも、AIとの連携フローも、すべて私(というかAI)が意図した通りに設計できます。
「今後、機能を追加したくなった時に、柔軟に対応できる拡張性」。
これを確保するために、あえて少しハードルの高い技術構成へと舵を切りました。
4. 「ハイブリッド会話」という貧乏…いや、工夫の産物
こうして出来上がったのが、高価なLive機能を使わない「疑似会話システム」です。
-
① アプリからの問いかけ:
アプリが「今日はどんな活動でしたか?」と文字を表示し、スマホ標準(無料)の機能で読み上げます。 -
② 先生の回答:
先生がマイクボタンを押して喋ります。これもスマホ標準(無料)で文字化されます。 -
③ AIの応答:
ここで初めて「Gemini 2.5 Flash」が登場。安価なテキスト処理だけで「それは楽しそう!特に誰が活躍してた?」と次の質問を返します。
ユーザー体験としては「会話」ですが、裏側では「テキストチャット」をしているだけ。
これならコストは爆安。でも、先生たちは「話し相手ができた!」と喜んでくれる。かもしれない。
「最新技術を全部盛り」にするのがDXではありません。
「現場が欲しい体験」を、「許容できるコスト」で実現するために、技術をパズルのように組み合わせる。
これこそが、中小企業が目指すべき「身の丈DX」の真髄ではないでしょうか。
5. すべては「お客様」のために
最後に、なぜここまでこだわるのか。
それは、会話によって引き出された「エピソード」が、保育園にとって最強のツールになるからです。
一方的な報告業務では出てこない「子供の細かな成長」や「クスッとする瞬間」。
これをAIとの雑談の中からすくい上げ、保護者に伝える。
「うちの子のこと、こんなに細かく見てくれてるんだ!」
その感動が信頼を生み、あらゆる好循環をつくります。
システムを柔軟にしたのも、AIを安くしたのも、すべてはこのサイクルを止めないため。
「効率化」の先にある「好循環」を見据えた投資なのです。
6. まとめ:あなたの会社に「Gemini 3.0」は本当に必要か?
今回の開発を通じて、改めて感じました。
世の中には「最新AI!」「多機能ツール!」といった広告が溢れていますが、本当に自社に必要なのは、もっとシンプルで、柔軟で、身の丈に合った仕組みかもしれません。
「ハイスペックな道具を買ったけど、使いこなせず放置している」
「やりたいことがあるのに、既製品の機能に縛られてできない」
そんなモヤモヤを抱えている経営者の方。
税理士として「数字」を見つつ、現役経営者として「現場」を知り、デジタル日曜大工職人として「実装」もわかる私と、一度お話ししませんか?
基本的な顧問契約(Core)で守りを固めつつ、
御社の課題にジャストフィットするIT戦略(Option)を提案する。
そんな「オプション選択型」のパートナーとして、無駄のないDXをサポートします。
Next.jsとSupabase……。
楽しい、、、この「何でも作れる自由さ」を知ってしまったら、もう戻れません。
現場の先生たちも「今日のAIさん、なんか優しい」なんて言いながら入力してくれるといいな、と思います。
機械相手に気を使わせないよう、AIの性格設定もほどほどにしておこうと思う今日この頃です。
「最適な道具」で、経営を軽くしませんか?
高すぎるツールはいりません。安すぎるツールも困ります。
あなたの会社の規模と目的に合った「ちょうどいいDX」を、
税理士・経営者の視点でご提案します。
※「ブログのアプリの話、面白かった」と言っていただければ、コードの話もしちゃいます