I'm Japanese. I'm interested in programming and AI.
Github: https://github.com/kajitaka1201
Note: https://note.com/kajitaka1201
プログラミング、AI系が好きです。
@kajitaka.bsky.social と同じ人です。そっちのアカウントでは、色々な人をフォローしたため、その方々のフォロワーの方がフォローしてくださっていて、これ自身は嬉しいのですが、趣味系の話を投稿する場所としては、あまりにもコミュニティーが大きすぎるため、この様な形で、新しいアカウントを作りました。
このアカウントでは、プログラミング、AI(基本的に文章生成)について、投稿する予定です。
今年もよろしくお願いします。
去年は、Noteを書き始めたり、このアカウントも本格的に動かし始めたりなど、自分にとっては始まりの年でした。
今年は、去年の様に、AIやプログラミングのことを投稿したりすると思います。
2度目ですが、去年はありがとうございました、そして今年もよろしくお願いします。
今年もよろしくお願いします。
去年は、Noteを書き始めたり、このアカウントも本格的に動かし始めたりなど、自分にとっては始まりの年でした。
今年は、去年の様に、AIやプログラミングのことを投稿したりすると思います。
2度目ですが、去年はありがとうございました、そして今年もよろしくお願いします。
LMArenaで、画像を作らせてみた(プロンプトは1枚目の画像)。
GPT Image 1.5(3枚目の画像):
* 日本語怪しい
* ○と◎の区別がない
* 改行がなく、比較内容の行のレイアウトが崩れている
Nano Banana Pro(2枚目の画像):
* 日本語も含め文字は正確
* 「日本語」と「ネットでの評価」の列が少し分かりづらい
* 注釈が灰色に見えず、黒
結果としては、日本語を使うなら、Nano Bana Proの方がいい
ただ、どちらも、Markdownの表を、それなりに正しく表示できているのは驚いた
LMArenaで、画像を作らせてみた(プロンプトは1枚目の画像)。
GPT Image 1.5(3枚目の画像):
* 日本語怪しい
* ○と◎の区別がない
* 改行がなく、比較内容の行のレイアウトが崩れている
Nano Banana Pro(2枚目の画像):
* 日本語も含め文字は正確
* 「日本語」と「ネットでの評価」の列が少し分かりづらい
* 注釈が灰色に見えず、黒
結果としては、日本語を使うなら、Nano Bana Proの方がいい
ただ、どちらも、Markdownの表を、それなりに正しく表示できているのは驚いた
LMArenaで対決させた。
プロンプト:「AIの仕組みを解説する画像を作って。」
GPT image 1.5:
* 日本語怪しい(特に漢字)
* 見た目は良さげ
* 内容は少しつっこみたいが、及第点
Nanobanana Pro:
* 日本語はほぼ使ってくれなかったが、文字の破綻はなさそう
* 内容は求めていたのとは少し違った(求めていたいのはGPTみたいな感じ)
このプロンプトだと、どちらの性能もまちまちといった感じ。
LMArenaで対決させた。
プロンプト:「AIの仕組みを解説する画像を作って。」
GPT image 1.5:
* 日本語怪しい(特に漢字)
* 見た目は良さげ
* 内容は少しつっこみたいが、及第点
Nanobanana Pro:
* 日本語はほぼ使ってくれなかったが、文字の破綻はなさそう
* 内容は求めていたのとは少し違った(求めていたいのはGPTみたいな感じ)
このプロンプトだと、どちらの性能もまちまちといった感じ。
LMArenaで「テトリスを作って。」のプロンプトで対決させた。
* Geminiはちゃんと動いた
* GPTは肝心の部分が表示されなかった(スコアとかを見ると裏では動いていそう)
ここで、ようやく差がでてきた。(1回だけだから、何とも言えないが...)
どちらにせよ、性能はどちらも高く、簡単には比較できない。
LMArenaで「テトリスを作って。」のプロンプトで対決させた。
* Geminiはちゃんと動いた
* GPTは肝心の部分が表示されなかった(スコアとかを見ると裏では動いていそう)
ここで、ようやく差がでてきた。(1回だけだから、何とも言えないが...)
どちらにせよ、性能はどちらも高く、簡単には比較できない。
LMArenaで、「2048ゲームを作って。」というプロンプトで戦わせた。(モデル名はスクショのALTに記載)
* Geminiは、数字が枠から少しズレている
* GPTはアニメーションがない
* どちらも、ゲームとして成立している
2048ゲームになると、どちらも少し破綻が出てくるが、ちょっと修正依頼で直りそうなレベル。まだどちらがいいのかは分からない。
LMArenaで、「2048ゲームを作って。」というプロンプトで戦わせた。(モデル名はスクショのALTに記載)
* Geminiは、数字が枠から少しズレている
* GPTはアニメーションがない
* どちらも、ゲームとして成立している
2048ゲームになると、どちらも少し破綻が出てくるが、ちょっと修正依頼で直りそうなレベル。まだどちらがいいのかは分からない。
LMArenaで、Gemini 3 Proと戦わせて、「電卓を作って。」というプロントで電卓を作らせた。(ALTにモデルを書いています)
* 完成が早かったのは、Geminiだったが、どちらもそれなりに時間がかかった
* どちらも、デザインに変な部分はない
* Geminiは、桁が多くても対応する
* GPTは、履歴の機能があって、計算の都合上、複数の演算記号が同時に使える
* 0除算は、どちらもエラーが出て、浮動小数点数は、それぞれ違う方法で対策している
まとめると、どちらも電卓レベルならば、ほぼ完璧。もっと難しいタスクでないと差はわからない。
LMArenaで、Gemini 3 Proと戦わせて、「電卓を作って。」というプロントで電卓を作らせた。(ALTにモデルを書いています)
* 完成が早かったのは、Geminiだったが、どちらもそれなりに時間がかかった
* どちらも、デザインに変な部分はない
* Geminiは、桁が多くても対応する
* GPTは、履歴の機能があって、計算の都合上、複数の演算記号が同時に使える
* 0除算は、どちらもエラーが出て、浮動小数点数は、それぞれ違う方法で対策している
まとめると、どちらも電卓レベルならば、ほぼ完璧。もっと難しいタスクでないと差はわからない。
前回、AIを使用せずにコーディングをやってみて、プログラミングとAIについて個人的な意見をまとめたのですが、今回は、バイブコーディングをやってみて感じたことです。
前回のものを読んでいない方は、そちらも是非お読みください。
note.com/kajitaka1201...
前回、AIを使用せずにコーディングをやってみて、プログラミングとAIについて個人的な意見をまとめたのですが、今回は、バイブコーディングをやってみて感じたことです。
前回のものを読んでいない方は、そちらも是非お読みください。
note.com/kajitaka1201...
電卓アプリに続き、「Todoアプリを作って。」という指示で、Canvasを使わせて、Todoアプリを作らせた。
* デザインは結構いい(分かりやすく、新しめUI)
* 追加や完了の機能も正常に動く
* 「完了済みを削除」を押すと完了にしたタスクが削除される機能付き
電卓アプリの時と同様、ウェブアプリのデザインは強め。速度も遅くない。
VibeCodingとか得意そう(GoogleがそういうIDEも作成していたくらいだし)。
電卓アプリに続き、「Todoアプリを作って。」という指示で、Canvasを使わせて、Todoアプリを作らせた。
* デザインは結構いい(分かりやすく、新しめUI)
* 追加や完了の機能も正常に動く
* 「完了済みを削除」を押すと完了にしたタスクが削除される機能付き
電卓アプリの時と同様、ウェブアプリのデザインは強め。速度も遅くない。
VibeCodingとか得意そう(GoogleがそういうIDEも作成していたくらいだし)。
ついに、Gmeini 3シリーズが出始めました
そのProモデルに、「電卓アプリを作って。」という指示で、Canvasを使わせて、電卓を作らせました(写真はスクリーンショット)
* デザインに大きな破綻なし
* 四則演算OK
* キーボードショートカット対応
* 浮動小数点数計算は問題が発生
* 0で割ったときには、Errorと出る
デザインなどに問題がないのは、ほぼまれで、速度も遅いという感じはしなかった。
1回目に、アイコン関連でエラーが発生していたが、自動でエラーを検知し、修正してくれた。
リーク通り、プログラミングの性能は高そう。
ついに、Gmeini 3シリーズが出始めました
そのProモデルに、「電卓アプリを作って。」という指示で、Canvasを使わせて、電卓を作らせました(写真はスクリーンショット)
* デザインに大きな破綻なし
* 四則演算OK
* キーボードショートカット対応
* 浮動小数点数計算は問題が発生
* 0で割ったときには、Errorと出る
デザインなどに問題がないのは、ほぼまれで、速度も遅いという感じはしなかった。
1回目に、アイコン関連でエラーが発生していたが、自動でエラーを検知し、修正してくれた。
リーク通り、プログラミングの性能は高そう。
AIを使用せずコーディングをしてみて、そこからプログラミングにおけるAIとの向き合い方について、個人的な感想をまとめてみたという内容です。
記事内にもある通り、「バイブコーディング編」(その名の通り、バイブコーディングを通して、この記事と同じことをするという内容)という記事を次に書こうと思っています。
note.com/kajitaka1201...
AIを使用せずコーディングをしてみて、そこからプログラミングにおけるAIとの向き合い方について、個人的な感想をまとめてみたという内容です。
記事内にもある通り、「バイブコーディング編」(その名の通り、バイブコーディングを通して、この記事と同じことをするという内容)という記事を次に書こうと思っています。
note.com/kajitaka1201...
* UIは独自に設計されていて、Chromeなどのシンプルなブラウザを使っている人からすると、少し慣れないといけない(いいか悪いかはその人次第)
* AIのエージェント機能は、複数画面を同時に操作していたりと、面白いが、性能はいまいち(途中まで正しかったのに結論が間違えていたり)
* AI機能は途中から有料
* 新規タブを開くときにわざわざ検索欄が出てきて入力しないといけないなど、若干使いにくい部分が存在
ちょっと使った感じの感想ですが、全体としては、AI機能は面白いが、普段使いは自分はしない、といった感じです。
fellou.ai
* UIは独自に設計されていて、Chromeなどのシンプルなブラウザを使っている人からすると、少し慣れないといけない(いいか悪いかはその人次第)
* AIのエージェント機能は、複数画面を同時に操作していたりと、面白いが、性能はいまいち(途中まで正しかったのに結論が間違えていたり)
* AI機能は途中から有料
* 新規タブを開くときにわざわざ検索欄が出てきて入力しないといけないなど、若干使いにくい部分が存在
ちょっと使った感じの感想ですが、全体としては、AI機能は面白いが、普段使いは自分はしない、といった感じです。
fellou.ai
電卓を、"Create a calculation app."という指示のみで作らせた。
* スピードは速い
* デザインに大きな破綻がない(最上位モデルでなく、破綻がないのは珍しいのでは)
* 四則演算などで、大きなバグはなさそう
* 演算記号を押した後も、もとの入力が保持されていて、同じ数が入る場合などでは、入力しずらい(9*9とか)
* 0で割ったときに、Infinityと出るが、その後は数字を入力したら、新しい計算が始まる
全体としては、一部使いづらい部分があったりするものの、結構いいし、スピードも速いので、プログラミングは強め。
電卓を、"Create a calculation app."という指示のみで作らせた。
* スピードは速い
* デザインに大きな破綻がない(最上位モデルでなく、破綻がないのは珍しいのでは)
* 四則演算などで、大きなバグはなさそう
* 演算記号を押した後も、もとの入力が保持されていて、同じ数が入る場合などでは、入力しずらい(9*9とか)
* 0で割ったときに、Infinityと出るが、その後は数字を入力したら、新しい計算が始まる
全体としては、一部使いづらい部分があったりするものの、結構いいし、スピードも速いので、プログラミングは強め。
数値上は、得点差が1点なので、逆転するかもしれないが、少なくとも、匹敵はしているのですごい。
そろそろGemini 3.0が出るという噂があるので、それがどうなるか。
数値上は、得点差が1点なので、逆転するかもしれないが、少なくとも、匹敵はしているのですごい。
そろそろGemini 3.0が出るという噂があるので、それがどうなるか。
プロンプトはGoogleが公開しているものを使いました。
現在少し問題となっている、ある企業のロゴっぽいものが生成される問題が発生したので、手動で編集してあります(白塗りしたため、若干違和感があると思います)
※生成AIの画像であり、販売するものではありません。
プロンプトはGoogleが公開しているものを使いました。
現在少し問題となっている、ある企業のロゴっぽいものが生成される問題が発生したので、手動で編集してあります(白塗りしたため、若干違和感があると思います)
※生成AIの画像であり、販売するものではありません。
今回は、PerplexityのAIブラウザCometを使用してみての感想と、AIブラウザについてです。
記事内にも書いてありますが、Cometの招待リンクを先日、ここ(Bluesky)で投稿しています(もしかすると、もう4つ全て使用されているかもしれません)。
note.com/kajitaka1201...
今回は、PerplexityのAIブラウザCometを使用してみての感想と、AIブラウザについてです。
記事内にも書いてありますが、Cometの招待リンクを先日、ここ(Bluesky)で投稿しています(もしかすると、もう4つ全て使用されているかもしれません)。
note.com/kajitaka1201...
1つにつき1人しか使用できないので、使用できない可能性があります。その際は、すみません。
また、数日かかるかもしれませんが、使用した感想をNoteにまとめる予定です。
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
1つにつき1人しか使用できないので、使用できない可能性があります。その際は、すみません。
また、数日かかるかもしれませんが、使用した感想をNoteにまとめる予定です。
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
perplexity.ai/browser/clai...
* イメージは、Google版のPerplexityみたいな感じ。
* スピードは、思ったよりも速く、待つ感じはしない。
* 普通の検索にもすぐ飛ぶことができ、そこはGoogleらしいといった感じ。
* 日付は、IPアドレスから取得した大体の位置情報をベースに答えているらしい。
* 試した時は、画像などのアップロードは、UI自体はあるが、問題が発生したと言って回答が生成されない(何か制限があるのかも)。
精度は、もう少し使ってみないとわからないが、今のところ、大きなハルシネーションはなさそう。
* イメージは、Google版のPerplexityみたいな感じ。
* スピードは、思ったよりも速く、待つ感じはしない。
* 普通の検索にもすぐ飛ぶことができ、そこはGoogleらしいといった感じ。
* 日付は、IPアドレスから取得した大体の位置情報をベースに答えているらしい。
* 試した時は、画像などのアップロードは、UI自体はあるが、問題が発生したと言って回答が生成されない(何か制限があるのかも)。
精度は、もう少し使ってみないとわからないが、今のところ、大きなハルシネーションはなさそう。
GPT-5で9.9-9.11を計算するように言った結果が画像の通り。
間違った、-0.21という結果を出してきた。
ちなみに、Gemini 2.5 Flashは、-0.02というまた別の間違いを、Gemini 2.5 Proも-0.21という結果を出した。
LMArenaでも少しやってみたが、-0.21という結果を出すモデルもそれなりに存在することが分かった。
9.9と9.11の大きさの比較はできても何故か計算ができないモデルたち...
GPT-5で9.9-9.11を計算するように言った結果が画像の通り。
間違った、-0.21という結果を出してきた。
ちなみに、Gemini 2.5 Flashは、-0.02というまた別の間違いを、Gemini 2.5 Proも-0.21という結果を出した。
LMArenaでも少しやってみたが、-0.21という結果を出すモデルもそれなりに存在することが分かった。
9.9と9.11の大きさの比較はできても何故か計算ができないモデルたち...
いつも、こちらで投稿している電卓を作らせるやつを、ベンチマークみたいに明文化しました。
最新のGPT-5やClaude Opus 4.1の結果も載せていますので、是非ご覧下さい。
note.com/kajitaka1201...
いつも、こちらで投稿している電卓を作らせるやつを、ベンチマークみたいに明文化しました。
最新のGPT-5やClaude Opus 4.1の結果も載せていますので、是非ご覧下さい。
note.com/kajitaka1201...
* 9.11と9.9の大小比較は見事、失敗
* strawberryのrの個数の問題は成功
* 検索機能もあり、日本の首相は正解
スピードは速く推論モデルかも微妙で、性能もいまいちなので、GPT-5ではない気がする。
あったとしてもGPT-5 nano、もしくはOpenAIのオープンモデルとかでは(そもそもOpenAIのモデルかも不明だけど)。
Horizon BetaはOpen Routerで利用可能です。
* 9.11と9.9の大小比較は見事、失敗
* strawberryのrの個数の問題は成功
* 検索機能もあり、日本の首相は正解
スピードは速く推論モデルかも微妙で、性能もいまいちなので、GPT-5ではない気がする。
あったとしてもGPT-5 nano、もしくはOpenAIのオープンモデルとかでは(そもそもOpenAIのモデルかも不明だけど)。
Horizon BetaはOpen Routerで利用可能です。
本日、Rakuten AI OPTIMISMに行き、そこで、楽天AIを使用したため、追加で使用してみて、使用感などをまとめました。
note.com/kajitaka1201...
本日、Rakuten AI OPTIMISMに行き、そこで、楽天AIを使用したため、追加で使用してみて、使用感などをまとめました。
note.com/kajitaka1201...
ChatGPT agentが出ているのを見たが、個人的には、AIが全てタスクを完了させるものではなく、自分が主でAIは手助けの役割でタスクをやるようなやつが欲しい。
それこそ、コーディングにおけるGithub CopilotやGemini Code Assistみたいな感じ。
最近はAI自体の性能は良いので、簡単なタスクなら全てやらせても問題は起きないが、難しくなると問題を起こし始めたり、意図していたこととは違うことを始めたりするので、そこら辺を制御出来る機能があればいいと思う(エージェントだけど途中で口出せたり、そもそも手助けツールだったりみたいな感じで)。
ChatGPT agentが出ているのを見たが、個人的には、AIが全てタスクを完了させるものではなく、自分が主でAIは手助けの役割でタスクをやるようなやつが欲しい。
それこそ、コーディングにおけるGithub CopilotやGemini Code Assistみたいな感じ。
最近はAI自体の性能は良いので、簡単なタスクなら全てやらせても問題は起きないが、難しくなると問題を起こし始めたり、意図していたこととは違うことを始めたりするので、そこら辺を制御出来る機能があればいいと思う(エージェントだけど途中で口出せたり、そもそも手助けツールだったりみたいな感じで)。