投稿

2月, 2026の投稿を表示しています

CopilotにFARGAN Codecで1kbps以下の音声コーデックが作れるか聞いてみた?

暇つぶしにRADEV2がQPSKで800Hzの帯域だとしたら多分800bpsぐらいになるだろうと思い1kbps以下でどの程度の性能になるかCopilotに聞いてみた。答えは10秒以内で得られて解析付きで驚いた。結果は聞くことはできるが自然性などは得られないという結論になっている。 ただし、 David August 2025, BBFM write up, RADE V2 OTA, Fine timing のV2を聞くと明らかに700Dより良い音でCopilotが言っているようにMELP600bitsより良い音だろうと期待している。上記のブログのV1と比較して聞くとよく聞けば違いは分かるけどそんなに絶対良いとは言えないように思う。これは通常なら比較の対象が6kbps以上の携帯のコーデックとなら違いは明確に分かるけれど、現状の1.6kbpsのV1と比較をせよと言われると1.6kbpsの半分になっても遜色ないし感度も上がるのでV2でよいのではとの結論になってしまうのかもしれない。 もう少し音質重視でSSBを完全に上回る国内通信(NVIS)向けの3~4kbpsあたりも開発したほうがJAとか欧州ユーザーには喜ばれるように思っている。先日3.5MHzでのローカルラグチューを聞いていたら、「相手がせめて千円のPC用のヘッドセットと1万円のマイクを使っているかの違いはこちらでわかるようにしてほしい」とのご希望はごもっともと思った次第。3~4kbpsあればCopilotの解析で使っている特徴量のビット配分で音造りの妙味が楽しめでそうだ。 コピーペーストができたので多分開示してよいのだと思って公開のボタンを押してみた。 🧩 What the page explains The page breaks down whether you can build a sub‑1 kbps speech codec using FARGAN , a neural vocoder. ⭐ Core conclusion Yes, sub‑1 kbps is possible , but only with extremely aggressive feature quantization . Speech will remain intelligible , but quality,...