個人開発 どこに向かうのか 2025

個人開発 どこに向かうのか 2025



daiiz
複雑GUI会で活動するSVG芸人
ソフトウェア作家、技術同人誌作家

興味
情報検索、推薦
LLMと外部知識・長期記憶の融合
GUI、SVG

技術同人誌作家活動
生成AIと検索の複合領域での技術進歩の観察
SVG、複雑GUI


ソフトウェア作家活動
定期的に個人開発のモチベーションを振り返っている
AIのおかげで様子がだいぶ変わってきた?


モチベーション
人類の知的生産活動を支援したい
興味関心事を長期的に記憶する
言語化されていない思考と創作の兆しを捉える
自然にアウトプットまで導きたい


モチベーション
蓄える、探す、組み合わせる
ここを強化するサービスを考えていきたい
その先にアウトプットがある
自分のツールで満足に活動できるているか?

開発中のソフトウェア
写真とスクリーンショットのナレッジベース
自分自身の分身を目指しているやつ
インスピレーションを広げるAIエージェント
VVStore
ローカルフォルダを整理するツール
Griddlet
大量のドキュメントをザッピングするツール
ここ最近で作っている


Phonno


Phonno
写真とスクリーンショットから知識抽出するプロジェクト
Photos + Annotations


Phonno: マルチモーダルRAG
LLMのマルチーモーダル性能を活用
画像から読み取れる知識の構造化



Phonno: Webページをクエリとして写真を探す
ウェブページを起点に、実世界での写真を掘り起こす
Chrome拡張のサイドパネル機能で実現

Expo 2025 公式マップのページを使った探索

ダッシュボード画面を使ってオフライン会場での写真を探せる
一日に撮られた写真列を事前にチャンク化してある


接点を増やす
自分で使ったものを毎日使いたい
いろんなところに動線を設ける
例: Chrome拡張機能で勝手にボタンを増やす

蓄積した情報に毎日触れる
過去の自分がビビッときたものはどこかで繋がるはず
と信じている


Okonomi
インスピレーションエージェント
広島お好み焼き食べているときに設計が固まった

人間活動で生まれた情報資産の有効活用
論文や書籍を読んで、根拠付きでレポートする
レポートに対して、蓄積したアイデアを投げかけて対話

開発近況はブログにて


探し出す技術がほしい
LLMのコンテキストに載せるべきデータを特定したい
ざっくりとあたりをつける技術


VVStore
Value-Value Store
データの価値を確率値で表現する

写真フォルダやダウンロードフォルダから目的のファイルを探す
集合写真、ポスターの写真
論文、領収書
ローカルLLMを使う練習を兼ねている
Gemma 3 4B を使っている
PaliGemma の方がよい?


VVStore
各ファイルについて質問して、答えとして、確からしさ(確率)を得る
LLMは0 ~ 1の範囲の数値を返すだけ
弱めのモデルでも出力が安定する
ダイナミックインデクシング
聞かれてから初めてインデックスを構築する
計算結果を使い回すのでだんだん速くなってくる

VVStore
確率の条件式を組み合わせてクエリを書く
js
Copied!
import { and, or, gte, lte, mirror } from "@daiiz/vvstore/dsl";

export const query = or(
gte("park", 0.9),
gte("sky", 0.9),
);

こんな感じで動く
「写真、かつ、食べ物または飲み物」
「公園または空が写っている写真」
「展示会のポスターやパネル資料、かつ、AI関連の話題」
「レシートが写っている写真」

Electoronでアプリ化して配布したい
相談: ローカルLLMどうすればいいか
いまはLM Studioに依存している


AIのおかげ①
テンションが上がる
なんか格好いいことしていそうな雰囲気づくり
例: W3CのWorking DraftっぽいCSSを当ててみる
AIとディスカッションして更新していく
ドキュメントをメンテナンスするのが楽しくなる


AIのおかげ②
いい感じの論文を探せる
どんな言語でも読める
英語
初めて書くプログラミング言語

Deep Researchが最高
海外の文献がアクセシブルになったと感じたのは今回のDeep Researchの体験が初めてかもしれない。読めるものが圧倒的に増えた。これはすごい!


これからは、個人研究開発
幅広い論文を読んだうえで開発できる
さらに難しいことにも取り組める
過去に諦めていたものを掘り返す

論文を読める
最近刺激を受けた論文

YouTubeの関連コンテンツをサジェストする仕組み
ベクトル検索の改良的なアイデア
推薦に使えるSemantic ID(整数値列)を与える
[7, 1, 4] [7, 1, 199] は類似している
各次元の数値が意味を持っていると考える

参考実装も見つかったのでforkして動かしてみた


Griddlet
Semantic ID 論文に影響を受けて作り始めた daiiz
CosensePhonnoに蓄積されているアイデアを串刺し検索ザッピング
接点増幅器としての役割を期待している

アレンジする
大前提: 個人開発は時間がない!!
元論文
アイテムIDとして、意味のある整数値列を生成している
整数値列を生成するためのモデルを学習する必要がある
エッセンスだけ真似してみる
意味のある数値 → 絵文字
IDを絵文字列で表現してもいいのではないか?
うまくいったら改めて本家に挑戦してみたい


Griddletのアイデア
各ドキュメントに3つの絵文字を割り当てる
絵文字で動画検索する研究がある
Query-by-Emoji Video Search (2015, University of Amsterdam)
専用モデルを学習する必要があり、当時は試せず
→ いまなら汎用モデルでいけるはず!

絵文字は抽象度が高い順にソートする
暗黙的に階層構造が得られる(あとで役に立つ)
たぶんSemantic IDの考え方にも近い

件のドキュメントを処理した結果
特徴捉えている?
💡💻
🧠🤖
🌐🔗
🍽️🍔


Griddlet
こんな感じで動く
ストーリーを作れる粒度でグループに分かれる

ざっくりとした問いかけでも大丈夫

リンクをShift+クリックして再検索
一撃でヒットしなくてもいずれ見つかればよい
探す過程から得られるものもある

Griddlet
フリーワード検索も可能
画像をクエリにすることもできるはず

ベクトル検索よりも推薦された理由を説明しやすい
絵文字列なので!


AIのおかげ③
Vibe codingでたたき台を高速に作れる
一日で失敗できる
メンタルを鍛える必要があるのかも
だいたいはつまらないものなので、連続で失敗するペースが速くなる
長く活動していくためには意外と大事


Griddlet(未来)
絵文字の分散対策
より抽象的な絵文字で置き換える
生成推薦
既存の絵文字とそれに紐づくドキュメントを使って新たなコンテンツを作れないか?
絵文字 [a,b,c] に関する新コンテンツを、 [a,b] [b,c] のものを組み合わせて生み出す


まとめ
人類のアウトプット支援の実現に向けて
関心情報を蓄積、探索、組み合わせる仕組みを作る
個人研究開発の時代
論文読める
参考実装探せる
手を出せなかった領域に挑戦できる
アイデアを強化できる、いい時代になりましたね!

Powered by Helpfeel