GatorTron GPT: కొత్త ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (AI) కంప్యూటర్ ప్రోగ్రామ్ వైద్యుల నోట్స్ను చాలా బాగా రూపొందించగలదు. GatorTron మోడల్స్ యొక్క ఉచిత వెర్షన్లు హగ్గింగ్ ఫేస్, ఓపెన్ సోర్స్ AI వెబ్సైట్ నుండి 430,000 కంటే ఎక్కువ డౌన్లోడ్లను కలిగి ఉన్నాయి. ఈ పరిశోధన గురించి జర్నల్ npj డిజిటల్ మెడిసిన్లో ప్రచురించబడింది. బృందం సహజమైన మానవ భాషను అనుకరించడానికి కంప్యూటర్లను అనుమతించే లార్జ్ లాంగ్వేజ్ మోడల్ భాషా నమూనాను అభివృద్ధి చేసింది.
ప్రధానాంశాలు
GatorTronGPT: కొత్త ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ (AI) కంప్యూటర్ ప్రోగ్రామ్ వైద్యుల నోట్స్ను చాలా బాగా రూపొందించగలదు. ఒక అధ్యయనం ప్రకారం… ఇద్దరు వైద్యులు తేడాను గుర్తించలేని విధంగా వైద్యుల నోట్స్ను చాలా ఖచ్చితంగా రూపొందించగల కొత్త AI సాధనం, పురోగతి సామర్థ్యాలతో ఆరోగ్య సంరక్షణ సిబ్బందికి సహాయం చేయడానికి AIకి త్వరలో తలుపులు తెరిచే అవకాశం ఉంది.
GatorTron GPT అనే కొత్త మోడల్
ఈ ప్రూఫ్-ఆఫ్-కాన్సెప్ట్ అధ్యయనంలో, వైద్యులు రోగి గమనికలను పరిశీలించారు. వాటిలో కొన్ని సూచనలు నిజమైన వైద్య నిపుణుల ద్వారా మరియు మరికొన్ని కొత్త AI వ్యవస్థ ద్వారా రచించబడ్డాయి. 49% మాత్రమే, వైద్యులు సరైన రచయితను గుర్తించగలిగారు. ఫ్లోరిడా విశ్వవిద్యాలయం మరియు NVIDIA నుండి 19 మంది పరిశోధకుల బృందం, ChatGPT వలె పని చేసే GatorTron GPT అనే కొత్త మోడల్ని ఉపయోగించి వైద్య రికార్డులను రూపొందించడానికి సూపర్ కంప్యూటర్లకు శిక్షణ ఇచ్చారు.
క్లినికల్ పరిశోధన కోసం అందుబాటులో ఉన్న ఏకైక నమూనా GatorTron
GatorTron మోడల్స్ యొక్క ఉచిత వెర్షన్లు హగ్గింగ్ ఫేస్, ఓపెన్ సోర్స్ AI వెబ్సైట్ నుండి 430,000 కంటే ఎక్కువ డౌన్లోడ్లను కలిగి ఉన్నాయి. ఫ్లోరిడా విశ్వవిద్యాలయం యొక్క ఆరోగ్య ఫలితాలు మరియు బయోమెడికల్ ఇన్ఫర్మేటిక్స్ విభాగానికి చెందిన ప్రధాన రచయిత యోంగ్హుయ్ వు ప్రకారం.. GatorTron మోడల్లు క్లినికల్ పరిశోధన కోసం అందుబాటులో ఉన్న సైట్ యొక్క ఏకైక నమూనాలు.
“ఆరోగ్య సంరక్షణలో, ప్రతి ఒక్కరూ ఈ నమూనాల గురించి మాట్లాడుతున్నారు. GatorTron మరియు GatorTronGPT అనేది వైద్య పరిశోధన మరియు ఆరోగ్య సంరక్షణ యొక్క అనేక అంశాలకు శక్తినివ్వగల ఏకైక AI నమూనాలు. అయినప్పటికీ, వాటిని రూపొందించడానికి భారీ డేటా మరియు విస్తృతమైన కంప్యూటింగ్ శక్తి అవసరం. దీన్ని కలిగి ఉన్నందుకు మేము కృతజ్ఞులం. NVIDIA నుండి సూపర్కంప్యూటర్, హైపెర్గేటర్,హెల్త్కేర్లో AI యొక్క సామర్థ్యాన్ని అన్వేషించడానికి ఉపయోగపడుతుంది” అని వు చెప్పారు.
GPT-3 ఆర్కిటెక్చర్
ఈ పరిశోధన గురించి జర్నల్ npj డిజిటల్ మెడిసిన్లో ప్రచురించబడింది. బృందం సహజమైన మానవ భాషను అనుకరించడానికి కంప్యూటర్లను అనుమతించే లార్జ్ లాంగ్వేజ్ మోడల్ భాషా నమూనాను అభివృద్ధి చేసింది.
ఈ నమూనాలు ప్రామాణిక రచన లేదా సంభాషణలతో బాగా పని చేస్తాయి. అయితే వైద్య రికార్డులు రోగుల గోప్యతను రక్షించాల్సిన అవసరం మరియు అత్యంత సాంకేతికంగా ఉండటం వంటి అదనపు అడ్డంకులను కలిగిస్తాయి.
ఈ అడ్డంకులను అధిగమించడానికి, పరిశోధకులు 82 బిలియన్ ఉపయోగకరమైన వైద్య పదాలను ఉంచుతూ రెండు మిలియన్ల రోగుల ఆరోగ్య వైద్య రికార్డులను ఉపయోగించారు. ఈ సెట్ను 195 బిలియన్ పదాల మరో డేటాసెట్తో కలిపి, వారు GPT-3 ఆర్కిటెక్చర్ లేదా జనరేటివ్ ప్రీ-ట్రైన్డ్ ట్రాన్స్ఫార్మర్, న్యూరల్ నెట్వర్క్ ఆర్కిటెక్చర్తో మెడికల్ డేటాను విశ్లేషించడానికి GatorTronGPT మోడల్కు శిక్షణ ఇచ్చారు.
GatorTron GPT విశ్లేషణ
హగ్గింగ్ ఫేస్ నివేదిక ప్రకారం.. యూనివర్శిటీ ఆఫ్ ఫ్లోరిడా మరియు NVIDIA మధ్య ఉమ్మడి ప్రయత్నంతో GatorTronGPT అభివృద్ధి చేయబడింది. GatorTronS అనేది 345 మిలియన్ పరిమితులతో కూడిన క్లినికల్ లాంగ్వేజ్ మోడల్, ఇది మెగాట్రాన్ ప్యాకేజీలో అమలు చేయబడిన BERT ఆర్కిటెక్చర్ను ఉపయోగించి ముందే శిక్షణ పొందింది.
MIMIC III డేటాబేస్ నుండి గుర్తించబడని నోట్స్లోని అన్ని విభాగాల నుండి ప్రారంభ 15 టోకెన్లను శాంపిల్ చేసాము మరియు సుమారు 8 మిలియన్ ప్రాంప్ట్లను రూపొందించాము. ఒక ప్రాంప్ట్ నుండి బహుళ పత్రాలను రూపొందించడానికి GatorTronGPTలో అనేక యాదృచ్ఛిక పరీక్షలను కూడా ప్రయత్నించాము. గరిష్టంగా 512 టోకెన్ల పొడవును రూపొందించడానికి GatorTronGPTని నియంత్రించాము. సింథటిక్ క్లినికల్ టెక్స్ట్ యొక్క మొత్తం 22 బిలియన్ పదాలను రూపొందించడానికి మేము GatorTronGPTని వర్తింపజేస్తాము” అని తెలిపారు.
277 బిలియన్ పదాల మిశ్రమ క్లినికల్ మరియు ఇంగ్లీష్ టెక్స్ట్లు
ఆరోగ్య సంరక్షణలో లార్జ్ లాంగ్వేజ్ మోడల్ లను (LLMలు) ఉపయోగించడంలో అపారమైన ఉత్సాహం మరియు ఆందోళనలు ఉన్నాయి. అయినప్పటికీ ప్రస్తుత అంచనాలు అన్నీ ChatGPT వంటి సాధారణ-ప్రయోజన LLMలపై ఆధారపడి ఉన్నాయి. ఈ అధ్యయనం 20 బిలియన్ పారామీటర్ల GPT-3 ఆర్కిటెక్చర్తో 277 బిలియన్ పదాల మిశ్రమ క్లినికల్ మరియు ఇంగ్లీష్ టెక్స్ట్లను ఉపయోగించి క్లినికల్ జెనరేటివ్ LLM, GatorTronGPTని అభివృద్ధి చేస్తుంది.
GatorTronGPT వైద్య పరిశోధన కోసం బయోమెడికల్ నేచురల్ లాంగ్వేజ్ ప్రాసెసింగ్ను మెరుగుపరుస్తుంది. GatorTronGPTని ఉపయోగించి శిక్షణ పొందిన సింథటిక్ NLP మోడల్లు వాస్తవ-ప్రపంచ క్లినికల్ టెక్స్ట్ని ఉపయోగించి శిక్షణ పొందిన NLP మోడళ్లను ఉత్పత్తి చేసిన టెక్స్ట్ను అధిగమించాయి. 1 (వరస్ట్) నుండి 9 (బెస్ట్) స్కేల్ని ఉపయోగించి వైద్యుల ట్యూటరింగ్ పరీక్ష భాషా రీడబిలిటీలో గణనీయమైన తేడా లేదని చూపిస్తుంది.
2020లో ప్రారంభించిన GatorTron GPT
blogs.nvidia ప్రకారం.. GatorTronGPT ప్రయత్నం అనేది 2020లో ప్రకటించిన ప్రతిష్టాత్మక సహకారం యొక్క తాజా ఫలితం , ఫ్లోరిడా విశ్వవిద్యాలయం మరియు NVIDIA విద్యారంగంలో ప్రపంచంలోనే అత్యంత వేగవంతమైన AI సూపర్కంప్యూటర్ని నిర్మించే ప్రణాళికలను ఆవిష్కరించాయి.
NVIDIA వ్యవస్థాపకుడు క్రిస్ మలాచోవ్స్కీ మరియు NVIDIA నుండి వచ్చిన సహకారాల కలయికతో ఈ చొరవ $50 మిలియన్ల బహుమతి ద్వారా నడపబడింది. AIని ఉపయోగించడం ద్వారా మరిన్ని AIలకి శిక్షణ ఇవ్వడం HiPerGator యొక్క ప్రభావానికి ఒక ఉదాహరణ మాత్రమే. సూపర్ కంప్యూటర్ వైద్య శాస్త్రాలలో మరియు ఫ్లోరిడా విశ్వవిద్యాలయంలోని అన్ని విభాగాలలో మరిన్ని ఆవిష్కరణలకు శక్తినివ్వడానికి హామీ ఇస్తుంది” అని తెలిపారు.
Also Read: OpenAI నుండి Microsoft లో చేరాలన్న Open AI CEO సామ్ ఆల్ట్మన్