Mula sa mga Pag-scan Hanggang sa Pagsasalita: Paano Na-re-re ang Googledefining Healthcare AI
Sa madaling sabi
Na-update ng Google ang open-source nitong MedGemma medical AI na may mga kakayahan para sa pagbibigay-kahulugan sa mga scan tulad ng CT at MRI, at naglabas din ng isang bukas na MedASR speech-to-text tool.
Kumpanya ng teknolohiya Google nag-anunsyo ng isang update sa modelo nito ng MedGemma AI, na nagpapahusay sa suporta para sa mga aplikasyon ng medical imaging.
Isinasama ng bagong modelo ng MedGemma 1.5 4B ang feedback mula sa komunidad ng mga developer upang mas mahusay na masuportahan ang maraming modalidad ng medical imaging, kabilang ang mga high-dimensional scan tulad ng CT at MRI, mga histopathology image, longitudinal imaging tulad ng chest X-ray time series, at mga gawain sa anatomical localization.
Pinapabuti rin nito ang pag-unawa sa mga dokumentong medikal, na nagbibigay-daan sa pagkuha ng nakabalangkas na datos mula sa mga ulat sa laboratoryo. Kung ikukumpara sa nakaraang MedGemma 1 4B, ang 1.5 4B update ay nag-aalok ng pinahusay na katumpakan para sa teksto, mga rekord ng medikal, at 2D imaging, habang nananatiling sapat na siksik upang tumakbo offline.
Para sa mas kumplikadong mga aplikasyong nakabatay sa teksto, maaaring ipagpatuloy ng mga developer ang paggamit ng mas malaking 27B parameter na modelo ng MedGemma. Ang mga kumpletong detalye at benchmark ay makukuha sa MedGemma 1.5 model card.
Ang MedGemma ay orihinal na binuo bilang isang multimodal system upang maipakita ang kumplikadong kapaligiran ng datos ng medisina, kasama ang mga naunang bersyon na sumusuporta sa interpretasyon ng mga two-dimensional na medikal na imahe tulad ng mga X-ray sa dibdib, mga imahe ng dermatology, retinal scan at mga sample ng histopathology. Ang pinakabagong release, ang MedGemma 1.5, ay nagpapalawak ng mga kakayahang ito upang maisama ang high-dimensional na medikal na imaging, na isinasama ang three-dimensional na CT at MRI data pati na rin ang whole-slide histopathology. Maaari na ngayong lumikha ang mga developer ng mga application na nagpoproseso ng maraming hiwa o patch ng imahe kasama ang mga task-specific prompt, na nagbibigay-daan sa mas advanced na diagnostic at analytical na mga kaso ng paggamit.
Ayon sa mga panloob na pagsusuri, ang MedGemma 1.5 ay nagpapakita ng mga kapansin-pansing pagpapabuti sa pagganap sa iba't ibang larangan, kabilang ang klasipikasyon ng mga natuklasan sa CT at MRI, pagsusuri ng histopathology, anatomical localization sa mga X-ray sa dibdib, longitudinal image review, at structured data extraction mula sa mga ulat sa laboratoryo. Nagpapakita rin ang modelo ng malaking mga pagbuti sa pag-unawa sa medikal na teksto at pagsagot sa mga tanong sa electronic health record, na sumasalamin sa mas malawak na pagsulong sa parehong paningin at pagganap sa wika.
Ang pinalawak na functionality na ito ay nakabatay sa mga naunang CT foundation tool ng Google at kumakatawan sa isa sa mga unang pampublikong available na open multimodal models na may kakayahang humawak ng high-dimensional medical data kasama ng tradisyonal na teksto at 2D imagery. Habang ang mga feature na ito ay patuloy na umuunlad, inaasahan ng kumpanya na makakamit ng mga developer ang mga karagdagang pagpapabuti sa pamamagitan ng domain-specific fine-tuning, na sinusuportahan ng mga bagong inilabas na tutorial at resources para sa mga aplikasyon ng CT at histopathology sa Hugging Face at Model Garden.
Ipinakilala ng Google ang MedASR upang Pahusayin ang Medical Speech Recognition at AI Clinical Workflows
Bukod pa rito, inilabas ng Google ang MedASR, isang bukas at awtomatikong modelo ng pagkilala sa pagsasalita na pinahusay para sa medikal na pagdidikta, na nagko-convert ng pagsasalita sa teksto at ipinapares sa MedGemma para sa mga advanced na gawain sa pangangatwiran.
Bagama't nananatiling dominanteng interface para sa malalaking modelo ng wika, ang pasalitang komunikasyon ay patuloy na gumaganap ng isang mahalagang papel sa klinikal na kasanayan, mula sa pagdidikta ng doktor hanggang sa mga konsultasyon sa pasyente sa real-time, na ginagawang isang mahalagang kakayahan ang tumpak na pagkilala sa pagsasalita.
Ang MedASR ay partikular na idinisenyo para sa wikang medikal, na nagbibigay-daan sa mas maaasahang transkripsyon ng mga terminolohiyang partikular sa domain at nagsisilbing natural na paraan ng pag-input para sa MedGemma. Sa paghahambing na pagsubok laban sa pangkalahatang layunin ng Whisper large-v3 model, nagpakita ang MedASR ng mas mataas na katumpakan, na nagbunga ng mas kaunting mga error sa transkripsyon sa parehong dikta ng X-ray sa dibdib at isang malawak na panloob na benchmark na sumasaklaw sa maraming espesyalidad sa medisina at mga profile ng tagapagsalita.
Ang lahat ng modelo ng HAI-DEF, kabilang ang MedGemma 1.5, MedASR, at ang MedSigLIP image encoder, ay nananatiling libre para sa pananaliksik at komersyal na paggamit at maaaring ma-access sa Hugging Face o maisama sa mga scalable na aplikasyon sa Vertex AI.
Nagkakamit ng Pandaigdigang Traksyon ang MedGemma Habang Pinalalawak ng mga Sistema ng Pangangalagang Pangkalusugan at mga Mananaliksik ang Pag-aampon ng AI
Ayon sa Google, lumalawak ang pag-aampon ng MedGemma sa mga startup ng teknolohiyang pangkalusugan at mga pangkat ng pananaliksik sa buong mundo, kung saan ang modelo ay lalong ginagamit upang mapabilis ang pag-unlad sa malawak na hanay ng mga aplikasyong medikal.
Sa Malaysia, isinama ng Qmed Asia ang MedGemma sa askCPG, isang sistemang pang-usap na idinisenyo upang magbigay ng access sa mahigit 150 pambansang alituntunin sa klinikal na kasanayan. Ayon sa Ministry of Health Malaysia, napabuti ng interface ang paggamit ng mga alituntuning ito sa mga regular na klinikal na paggawa ng desisyon, habang ang mga naunang pilot program ay nag-ulat ng partikular na malakas na feedback sa mga multimodal medical imaging feature ng platform na pinapagana ng MedGemma.
Sa Taiwan, ginamit ng National Health Insurance Administration ang MedGemma upang suriin ang mga preoperative na pagtatasa para sa operasyon sa kanser sa baga. Sa pamamagitan ng pagkuha ng mga nakabalangkas na pananaw mula sa sampu-sampung libong ulat ng patolohiya at iba pang hindi nakabalangkas na klinikal na datos, sinusuportahan ng inisyatibo ang malawakang pagsusuring pang-estadistika na nilayon upang magbigay-alam sa mga desisyon sa patakaran at mapabuti ang pagpaplano ng operasyon at mga resulta ng pasyente.
Simula nang ilabas ito ngayong taon, ang MedGemma ay malawakang nabanggit din sa mga akademikong medikal na AI pananaliksik, kung saan nagpakita ito ng matibay na pagganap bilang isang pundamental na modelo para sa mga gawain tulad ng pag-unawa sa medikal na teksto, suporta sa klinikal na desisyon sa maraming disiplina, at pag-uulat ng mammography.
Pagtanggi sa pananagutan
Sa linya na may Mga alituntunin ng Trust Project, pakitandaan na ang impormasyong ibinigay sa pahinang ito ay hindi nilayon at hindi dapat bigyang-kahulugan bilang legal, buwis, pamumuhunan, pananalapi, o anumang iba pang paraan ng payo. Mahalagang mamuhunan lamang kung ano ang maaari mong mawala at humingi ng independiyenteng payo sa pananalapi kung mayroon kang anumang mga pagdududa. Para sa karagdagang impormasyon, iminumungkahi naming sumangguni sa mga tuntunin at kundisyon pati na rin sa mga pahina ng tulong at suporta na ibinigay ng nagbigay o advertiser. MetaversePost ay nakatuon sa tumpak, walang pinapanigan na pag-uulat, ngunit ang mga kondisyon ng merkado ay maaaring magbago nang walang abiso.
Tungkol sa Ang May-akda
Alisa, isang dedikadong mamamahayag sa MPost, dalubhasa sa cryptocurrency, zero-knowledge proofs, investments, at ang malawak na larangan ng Web3. Sa isang matalas na mata para sa mga umuusbong na uso at teknolohiya, naghahatid siya ng komprehensibong saklaw upang ipaalam at hikayatin ang mga mambabasa sa patuloy na umuusbong na tanawin ng digital finance.
Mas marami pang artikulo
Alisa, isang dedikadong mamamahayag sa MPost, dalubhasa sa cryptocurrency, zero-knowledge proofs, investments, at ang malawak na larangan ng Web3. Sa isang matalas na mata para sa mga umuusbong na uso at teknolohiya, naghahatid siya ng komprehensibong saklaw upang ipaalam at hikayatin ang mga mambabasa sa patuloy na umuusbong na tanawin ng digital finance.