
Semua kandungan iLive disemak secara perubatan atau fakta diperiksa untuk memastikan ketepatan faktual sebanyak mungkin.
Kami mempunyai garis panduan sumber yang ketat dan hanya memautkan ke tapak media yang bereputasi, institusi penyelidikan akademik dan, apabila mungkin, dikaji semula kajian secara medis. Perhatikan bahawa nombor dalam kurungan ([1], [2], dan lain-lain) boleh diklik pautan ke kajian ini.
Jika anda merasakan bahawa mana-mana kandungan kami tidak tepat, ketinggalan zaman, atau tidak dipersoalkan, sila pilih dan tekan Ctrl + Enter.
Suara sebagai Analisis: Isyarat Awal Kanser dan Lesi Benign
Ulasan terakhir: 18.08.2025

Penyelidik dari Oregon Health & Science University menganalisis rakaman pertuturan daripada dataset Bridge2AI-Voice baharu yang tersedia secara terbuka dan menemui ciri akustik ringkas yang boleh mendedahkan patologi lipatan vokal. Kita bercakap tentang nisbah harmonik kepada hingar (HNR) — nisbah "nada muzik" kepada bunyi. Tahap dan kebolehubahannya membezakan suara orang yang menghidap kanser laring dan lesi benigna daripada yang sihat dan beberapa gangguan suara yang lain. Kesannya amat ketara pada lelaki cisgender; kepentingan statistik tidak mencukupi untuk wanita - penulis menyalahkan saiz sampel yang kecil dan meminta pengembangan data. Kerja itu diterbitkan sebagai laporan ringkas dalam Frontiers dalam Kesihatan Digital.
Latar belakang kajian
- Mengapa mencari "penanda suara" sama sekali. Suara serak adalah aduan biasa. Puncanya berbeza-beza: daripada selsema dan refluks kepada nodul/polip dan kanser laring. Pada masa ini, laluan untuk diagnosis ialah lawatan ke pakar ENT dan endoskopi (kamera di hidung/tekak). Ia tepat, tetapi tidak selalu tersedia dengan cepat dan tidak sesuai untuk pemantauan kendiri di rumah. Pra-saringan diperlukan: cara mudah untuk memahami siapa yang harus berjumpa doktor terlebih dahulu.
- Apakah biomarker suara? Pertuturan ialah isyarat yang boleh dirakam dengan mudah pada telefon. "Corak"nya boleh digunakan untuk menilai bagaimana lipatan vokal bergetar. Luka membuat getaran tidak sekata: lebih banyak "bising" dan kurang "muzik".
- Mengapa set data baharu penting. Sebelum ini, kerja sedemikian bergantung pada sampel kecil "buatan sendiri" - modelnya rapuh. Bridge2AI-Voice ialah set rakaman audio yang besar, berbilang pusat, dikumpulkan secara beretika yang dikaitkan dengan diagnosis. Ia dicipta sebagai "tapak ujian biasa" untuk akhirnya melatih dan menguji algoritma pada data yang besar dan heterogen.
- Di manakah kesukaran utama?
- Suara berubah disebabkan oleh mikrofon, bunyi bilik, sejuk, merokok, bahasa, jantina dan umur.
- Terdapat kurang data wanita secara tradisinya, dan frekuensi suara wanita lebih tinggi - metrik berkelakuan berbeza.
- Tiada ujian "rumah" boleh menggantikan pemeriksaan atau membuat diagnosis - paling banyak, ia membantu untuk memutuskan: "adakah perlu berjumpa pakar ENT dengan segera?"
- Mengapakah klinik dan pesakit memerlukan ini? Jika orang yang mempunyai risiko tinggi untuk nod/tumor boleh dipilih untuk temu janji keutamaan dengan janji temu yang singkat, ini akan mempercepatkan diagnostik, mengurangkan rujukan yang tidak perlu dan menyediakan alat untuk memantau diri antara lawatan (selepas pembedahan, semasa terapi).
- Di mana ini harus membawa: Untuk mengesahkan aplikasi/modul teleperubatan yang:
- tulis ucapan mengikut standard (frasa + "aaa") yang dilukis keluar,
- mengira ciri asas (HNR, jitter, shimmer, F0),
- mengeluarkan cadangan untuk menghubungi pakar jika profil itu membimbangkan,
- mengekalkan dinamik selepas rawatan.
Ideanya mudah: "berikan telefon ke telinga doktor ENT" - bukan untuk diagnosis, tetapi supaya tidak terlepas mereka yang memerlukan bantuan bersemuka yang cepat.
Apa sebenarnya yang mereka lakukan?
- Kami mengambil keluaran pertama kumpulan data Bridge2AI-Voice berbilang pusat yang dikumpul secara beretika, projek NIH utama di mana rakaman suara dipautkan kepada maklumat klinikal (diagnosa, soal selidik, dsb.).
- Dua sampel analisis telah dibentuk:
- "kanser laryngeal / nod benigna / sihat";
- "kanser atau nodul jinak" berbanding disfonia spasmodik dan lumpuh lipatan vokal (punca lazim lain yang menyebabkan suara serak).
- Ciri suara asas telah dikenal pasti daripada frasa piawai: nada asas (F0), jitter, shimmer dan HNR, dan kumpulan dibandingkan menggunakan statistik bukan parametrik. Keputusan: perbezaan yang paling stabil adalah dalam HNR dan F0, dengan HNR dan kebolehubahannya memisahkan lesi jinak dari kedua-dua norma dan kanser laring. Isyarat ini lebih jelas pada lelaki.
Mengapa ini penting?
- Pemeriksaan awal tanpa siasatan. Pada masa ini, laluan untuk diagnosis selalunya bermakna nasoendoskopi dan, jika disyaki, biopsi. Jika ciri akustik ringkas digabungkan dengan AI boleh mengutamakan mereka yang memerlukan endoskopi, pesakit akan mendapatkan pakar ENT lebih awal dan rujukan yang tidak perlu akan dikurangkan. Ini adalah pelengkap, bukan pengganti doktor.
- Data besar untuk suara. Bridge2AI-Voice ialah projek yang jarang berlaku di mana suara dikumpul menggunakan protokol seragam dan dikaitkan dengan diagnosis; data tersedia kepada penyelidik melalui PhysioNet / Health Data Nexus. Ini mempercepatkan pembangunan biomarker suara yang boleh dipercayai dan bukannya "aplikasi ajaib" pada sampel kecil.
Apakah HNR?
Apabila kita bercakap, lipatan vokal bergetar dan mencipta nada (harmonik). Tetapi getaran tidak pernah sempurna - sentiasa ada bunyi dalam isyarat. HNR hanyalah berapa banyak lagi "muzik" yang terdapat dalam suara daripada "desis". Apabila lipatan rosak, getaran menjadi kurang sekata - terdapat lebih banyak bunyi, HNR jatuh, dan lompatannya (kebolehubahan) meningkat. Ini adalah corak yang ditangkap oleh penulis.
Penafian Penting
- Ini adalah analisis perintis, penerokaan: tanpa pengesahan klinikal, dengan sekatan pada sampel wanita - jadi kesannya tidak ketara. Data yang lebih besar dan lebih pelbagai dan "memanggang" model di klinik yang berbeza dan dalam bahasa yang berbeza diperlukan.
- Suara adalah perkara "berbilang nilai": ia dipengaruhi oleh selsema, merokok, refluks, mikrofon, bunyi bising di dalam bilik. Mana-mana "ujian rumah" sepatutnya boleh mengambil kira konteks - dan masih berfungsi sebagai penapis untuk rujukan kepada pakar ENT, dan bukan diagnosis klik lalu.
Apa seterusnya?
- Kembangkan set data (termasuk untuk wanita dan umur), piawaikan tugas dan akustik (membaca frasa, "aaa" yang berpanjangan, dsb.), cuba model pelbagai mod (simptom suara + soal selidik/faktor risiko).
- Pautkan tanda akustik dengan keputusan peperiksaan (endoskopi, stroboskopi) dan dinamik selepas rawatan - supaya profil HNR juga boleh digunakan untuk pemantauan.
- Teruskan "sains terbuka": Bridge2AI-Voice sudah pun menerbitkan versi set data dan alatan - ini adalah peluang untuk menghubungi juruterbang sebenar di klinik dengan cepat.
Kesimpulan
Adalah mungkin untuk "mendengar" masalah lipatan vokal daripada suara - dan mungkin merujuk orang itu kepada pakar yang betul lebih awal. Buat masa ini, ia adalah petunjuk yang cukup (HNR dan kebolehubahannya), tetapi terima kasih kepada data terbuka yang besar, biomarker suara akhirnya mempunyai peluang untuk menjadi alat pemeriksaan yang boleh dipercayai.
Sumber: Jenkins P. et al. Suara sebagai Biomarker: Analisis Penerokaan untuk Lesi Lipatan Vokal Benign dan Malignant. Frontiers in Digital Health, 2025 (diterima untuk diterbitkan). Data — Bridge2AI-Voice (NIH/PhysioNet).