Mitecat
@sudoms.bsky.social
26 followers 50 following 540 posts
Researcher | Ph.D. in Agriculture | He/Him | Population Ecology, Applied Statistics, Machine Learning, Tea Pest Management | https://orcid.org/0000-0001-9834-9857 | https://github.com/sudoms | https://sudori.info/
Posts Media Videos Starter Packs
良い子のみんなは、なぜ彗星の尾が輝くのか、お家の人に聞いてみようねぇ
新しいJeconetの会員ガイドラインを読んでいるが、
esj.ne.jp/esj/Jeconet....

4.商行為
メーリングリストでは営利目的の投稿を禁止する場合もありますが、Jeconetでは生態学に関する新書の紹介や講演の案内などについては投稿を認めます。

という部分は「新書」だと別の意味になってしまう。「新刊書籍」なのでは?
Jeconet
esj.ne.jp
ようやく誤家庭でもハイエンドGPUをぶん回せる季節になったので Qwen-Image-Edit-2509 で昆虫を線画化して遊んでいるが、これが一発で変換できるようになったのには驚いた
ぼちぼち職場の周りもカメムシが増えてきたなぁ。とはいえ今の所、例年通りの量ではある。昨年が異常に多かった。
研究者の情報発信としては Bluesky が比較的活用されるようになってきているという傾向が、ここから見えるわけだが、果たして固定されたフォロー・フォロワー外への拡散はどの程度起こっているのだろうか。

まあ近日中に新しいプレプリントを出す予定なので、その反応を見れば自分が関連する研究分野での利用状況は、なんとなく見積もれるだろう。
5 million of them are about research
graph showing Timelapse of 4,949,864 posts linking to research items
何しろアンケートである以上は自認ベースなので、「普通の会社員よりも高収入」という程度の上流なのか、本当にエスタブリッシュメントという意味での上流を自認している人々による回答なのかは、現段階では不明です。

メタバース上の今後の経済動向を考える上で面白そうなのは、収入はそこそこだが趣味には金を惜しまないという層だけに VR の利用が留まるのか、その気になれば実体験を得られる金持ちでも、あえて VR ならではの体験を求める層が登場するのか(そもそも、そのようなキラーコンテンツが登場するか)の分岐だと思っています
何しろ有機表示の可能な殺菌剤というのは、銅ないし硫黄を含む製品が相当なシェアを占めているわけで、病害の確実なコントロールを諦めろと言っているようなものである
以前から行われている、VR ユーザーへのアンケート調査シリーズの一環。
なお本レポート内で、VRユーザーに上流階層はあまりいないという結論が導かれているのだが、これを言おうとすると厳密には 「一般に VR 外で上流階層を自認する人の構成割合が x% とされている」に対して「VR 内では m/n だった」というデータを用意し、適合度検定を行う必要があるだろう
ブラウザ上の Bluesky のトレンドに、Mariners が 2 つ同時に出てきている。
なんでそんなことになるのかと思ってリンクを調べたら、同じキーワードを持つ別々のフィードが作成されているようだ。
県央の島田、吉田あたりのさわやかはそこまで狂った混み方をしていなくて、フェア期間中以外の平日ならば来客をとりあえず昼飯に連れて行く程度の使い方が可能である。まあ静岡県が東西に長すぎて、真ん中が寂れるわけだ
Reposted by Mitecat
静岡きて5年目だがさわやかの狂った混み方はいまだに謎。こわいよ
誰かによって所有されうるプラットフォームは本質的に検閲耐性がない。 Twitter(現 X)は邪悪になり、Bluesky も将来的にそうなる。だから本気でコンテンツを提供しようとすると完全 P2P 型、もしくは Nostr のように単一の中継ノードに依存せずにユーザーが繋がれる構造の SNS を普及させる必要がある。
sudori.info/etc/etc_blue...
このような構造はリッチコンテンツの配信や、素早くバズりたいというインフルエンサー志望層の欲求と相性が悪いため、今まで普及してこなかった。しかし昨今の社会情勢に鑑み、そろそろ本気(マジ)になる頃合いかと思う。
そういえば中高生の頃は部活で全国大会に出るなんてのは夢のまた夢だった。
学会発表だと最初から全国大会に出るのは当たり前だし、論文を投稿したり OSS に貢献したりすれば自ずと世界を相手にするわけだから、随分スケールが大きくなったなァと思う
Alex Shapiro の "Homecoming"
www.youtube.com/watch?v=96Z7...
吹奏楽+(エレキギター、エレピ、エレキベース)による楽曲の例。
この曲の場合はサウンドの土台を担わせるというよりも、吹奏楽に鍵盤楽器を混ぜるときのように音色の選択肢を増やす意味合いが強いのだと思う。

日本だと吹奏楽コンクールの電子楽器使用が完全に禁止されてしまったため、このタイプのサウンドは当面発展しないのではないだろうか。
"Homecoming," Alex Shapiro | West Point Band
YouTube video by West Point Band
www.youtube.com
私の予想では、最後の 16kHz 波形復元部分に使っている Vocos を HiFi-GAN ベースのニューラルボコーダに置き換えて 24kHz ないし 48kHz 化し*1、さらにネタ音声を高音質なデータセットに置き換えて訓練すれば、普及帯の GPU で「聖杯*2」が実現すると思う

(*1 ボコーダで復元した喋り声において SR = 16kHz は十分聞き取れるが、鑑賞用には高音域の張り:fidelity が足りないため最低 24kHz が欲しい)

(*2 いかなる人でも、好みの声で生配信ができるボイチェンを指す、一部界隈の用語)
デモ音声はこちら。
aslp-lab.github.io/MeanVC/

Seed-VC のほうが声質+録音条件まで含めたスタイル全体の再現は高精度な気がする。

ただし MeanVC の速度は AMD EPYC 7542 の CPU シングルスレッドで ASR 部分が RTF = 0.12、ボコーダが RTF = 0.066 で総計 RTF = 0.322 である。
つまり CUDA 等に頼らずとも現実世界の 3 倍速で処理できるわけで、リアルタイム性という点ではかなりいい線を行っている。
MeanVC
aslp-lab.github.io
Reposted by Mitecat
MeanVC, a streaming zero-shot voice conversion approach, uses a diffusion transformer with chunk-wise AR denoising and mean flows for efficient processing, achieving higher conversion quality with fewer parameters.
MeanVC: Lightweight and Streaming Zero-Shot Voice Conversion via Mean Flows
Guobin Ma, Jixun Yao, Ziqian Ning, Yuepeng Jiang, Lingxin Xiong, Lei Xie, Pengcheng Zhu
arxiv.org