CopilotにFARGAN Codecで1kbps以下の音声コーデックが作れるか聞いてみた?
暇つぶしにRADEV2がQPSKで800Hzの帯域だとしたら多分800bpsぐらいになるだろうと思い1kbps以下でどの程度の性能になるかCopilotに聞いてみた。答えは10秒以内で得られて解析付きで驚いた。結果は聞くことはできるが自然性などは得られないという結論になっている。 ただし、 David August 2025, BBFM write up, RADE V2 OTA, Fine timing のV2を聞くと明らかに700Dより良い音でCopilotが言っているようにMELP600bitsより良い音だろうと期待している。上記のブログのV1と比較して聞くとよく聞けば違いは分かるけどそんなに絶対良いとは言えないように思う。 CODECの評価は常に原音との主観比較(MOS評価)を行うものと思うが現状の1.6kbpsのV1と比較をせよと言われると「1.6kbpsの半分になってもintelligibleは遜色ないし感度も上がるのでV2でよいのでは」との結論になってしまうのかもしれない。もう少し音質重視でSSBを完全に上回る国内通信(NVIS)向けの3~4kbpsあたりも開発したほうがJAとか欧州ユーザーには喜ばれるように思っている。 先日3.5MHzでのローカルラグチューを聞いていたら、「相手がせめて千円のPC用のヘッドセットと1万円のマイクを使っているかの違いはこちらでわかるようにしてほしい」とのご希望はごもっともと思った次第。昔からCODECは案外匠で泥臭い世界のであまりとやかく言わないほうが安全と思っていたが、3~4kbpsあれば耳の肥えたラグチュウマンにはCopilotの解析で使っている特徴量のビット再配分で音造りの妙味が楽しんでいただける領域になると思う。 コピーペーストができたので多分開示してよいのだと思って公開のボタンを押してみた。 🧩 What the page explains The page breaks down whether you can build a sub‑1 kbps speech codec using FARGAN , a neural vocoder. ⭐ Core conclusion Yes, sub‑1 kbps is possible , but only with extremely aggres...