Games

డాల్ఫిన్స్ ఏమి చెబుతున్నారో అర్థం చేసుకోవడానికి గూగుల్ డాల్ఫింగేమా, కొత్త LLM ను ప్రారంభించింది

రోజుల తరువాత జెమిని 2.5 ప్రో ప్రయోగాత్మక చేత నడిచే లోతైన పరిశోధనను ప్రారంభించడంగూగుల్ డాల్ఫింగేమా అనే కొత్త మోడల్‌తో మళ్ళీ తిరిగి వచ్చింది. ఈ పెద్ద భాషా నమూనా శాస్త్రవేత్తలకు “డాల్ఫిన్లు ఎలా సంభాషించాలో అధ్యయనం” మరియు “వారు ఏమి చెబుతున్నారో కూడా తెలుసుకోండి” అని సహాయపడుతుంది.

సంస్థ జార్జియా టెక్ మరియు ది పరిశోధకులతో కలిసి పనిచేస్తోంది వైల్డ్ డాల్ఫిన్ ప్రాజెక్ట్ (డబ్ల్యుడిపి)దాని వ్యవస్థాపకుడు డాక్టర్ డెనిస్ హెర్జింగ్ నేతృత్వంలో. WDP యొక్క ప్రాధమిక లక్ష్యం, మీరు బహుశా can హించినట్లుగా, సహజ ప్రవర్తనలు, సామాజిక నిర్మాణాలు, కమ్యూనికేషన్ నమూనాలు మరియు అడవి డాల్ఫిన్ల ఆవాసాలపై గమనించడం, డాక్యుమెంట్ చేయడం మరియు నివేదించడం, ప్రత్యేకంగా అట్లాంటిక్ మచ్చల డాల్ఫిన్ (స్టెనెల్లా ఫ్రంటాలిస్)“నాన్-ఇన్వాసివ్, దీర్ఘకాలిక క్షేత్ర పరిశోధన” ద్వారా.

సంవత్సరాలుగా, WDP డేటాను సేకరించింది, ఇది కొన్ని డాల్ఫిన్ శబ్దాలను ప్రవర్తనలతో పరస్పరం అనుసంధానించడానికి అనుమతిస్తుంది. ఉదాహరణకు:

  • సంతకం ఈలలు (ప్రత్యేకమైన పేర్లు) తల్లులు మరియు దూడలు తిరిగి కలపడానికి ఉపయోగించవచ్చు
  • పోరాటాల సమయంలో తరచుగా కనిపించే పేలుడు-పల్స్ “స్క్వాక్స్”
  • కోర్ట్ షిప్ సమయంలో తరచుగా ఉపయోగించే “బజ్స్” క్లిక్ చేయండి లేదా సొరచేపలను వెంటాడుతుంది

గూగుల్ ప్రకారం, “డాల్ఫిన్స్ యొక్క సహజమైన, సంక్లిష్టమైన కమ్యూనికేషన్‌ను విశ్లేషించడం ఒక స్మారక పని, మరియు WDP యొక్క విస్తారమైన, లేబుల్ చేయబడిన డేటాసెట్ అత్యాధునిక AI కోసం ఒక ప్రత్యేకమైన అవకాశాన్ని అందిస్తుంది.”

అక్కడే డాల్ఫింగేమా వస్తుంది. సరళంగా చెప్పాలంటే, ఇది WDP యొక్క డేటాసెట్‌లో గూగుల్ అభివృద్ధి చేసిన AI మోడల్, ఇది డాల్ఫిన్ స్వరాలను మరింత నిర్వహించదగిన ఆడియో యూనిట్లుగా విచ్ఛిన్నం చేయడానికి గూగుల్ యొక్క స్వంత సౌండ్‌స్ట్రీమ్ టోకనైజర్‌ను ఉపయోగిస్తుంది.

సంక్లిష్ట సన్నివేశాలను అర్ధవంతం చేయడానికి రూపొందించిన ప్రత్యేకమైన మోడల్ ఆర్కిటెక్చర్ ద్వారా ఇవి నడుస్తాయి. మొత్తం సెటప్ సుమారు 400 మిలియన్ పారామితుల వద్ద ఉంది, ఇది పిక్సెల్ ఫోన్‌లలో స్థానికంగా నడపడానికి తగినంత తేలికగా ఉంటుంది, WDP పరిశోధకులు వారితో ఈ రంగంలో తీసుకువెళతారు.

ఇప్పుడు, సాంప్రదాయ యంత్ర అభ్యాస నమూనాల మాదిరిగా కాకుండా, డాల్ఫింగేమా పదాలు లేదా చిత్రాలలో వ్యవహరించదు; ఇది ఖచ్చితంగా ఆడియో-ఇన్, ఆడియో-అవుట్. ఇది సహజ డాల్ఫిన్ గాత్రాల సన్నివేశాలను తీసుకుంటుంది, పెద్ద భాషా నమూనాలు మానవ ప్రసంగాన్ని ఎలా అర్థం చేసుకుంటాయో ప్రేరణ పొందిన విధానాన్ని ఉపయోగించి వాటిని ప్రాసెస్ చేస్తుంది మరియు ఒక క్రమంలో తదుపరి శబ్దాన్ని అంచనా వేస్తుంది.

డాక్టర్ డెనిస్ హెర్జింగ్ దీనిని స్వయంప్రతిపత్తితో పోల్చారు, కానీ డాల్ఫిన్ ఈలలు, పేలుడు పప్పులు మరియు క్లిక్ రైళ్లు. ఈ శబ్దాలలో నమూనాలు, నిర్మాణం మరియు పురోగతిని గుర్తించడానికి ఇది శిక్షణ పొందింది, టెక్స్ట్-ఆధారిత మోడల్ సందర్భం ఆధారంగా ఒక వాక్యంలో తదుపరి పదాన్ని ఎలా అంచనా వేస్తుంది.

గూగుల్ డాల్ఫింగెమ్మతో పాటు రాకముందే, డబ్ల్యుడిపిలోని పరిశోధకుల బృందం డాల్ఫిన్లతో రెండు-మార్గం కమ్యూనికేషన్ యొక్క అవకాశాన్ని అన్వేషించడానికి చాట్ (సెటాసియన్ హియరింగ్ ఆగ్మెంటేషన్ టెలిమెట్రీ) ను ఉపయోగిస్తోంది. చాట్‌తో ఉన్న లక్ష్యం డాల్ఫిన్ భాష యొక్క పూర్తి సంక్లిష్టతను పగులగొట్టడం కాదు, పరస్పర చర్య కోసం సరళమైన, భాగస్వామ్య పదజాలం నిర్మించడం.

చాట్ చేత సృష్టించబడిన కొత్త, సింథటిక్ ఈలలను అనుబంధించడం ద్వారా సిస్టమ్ పనిచేస్తుంది, నిర్దిష్ట వస్తువులతో డాల్ఫిన్లు ఆనందించేలా కనిపిస్తాయి. సర్గాసమ్, సీగ్రాస్ లేదా పరిశోధకులు ఉపయోగించే కండువాలు వంటివి ఆలోచించండి.

ఈ సింథటిక్ ఈలలను పదేపదే వస్తువులతో అనుబంధించడం ద్వారా, డాల్ఫిన్లు ఆ వస్తువుల కోసం “అడగడానికి” శబ్దాలను అనుకరించడం ప్రారంభిస్తాయని ఆశ.

చాట్ గూగుల్ పిక్సెల్ 6 ను ఆపివేసింది, ఇది నిజ సమయంలో అధిక-నాణ్యత ఆడియో విశ్లేషణను నిర్వహించింది. ఆఫ్-ది-షెల్ఫ్ ఫోన్‌లను ఉపయోగించడం అంటే జట్టుకు కస్టమ్ గేర్ అవసరం లేదు. ఇది విషయాలను చిన్నదిగా, చౌకగా, మరింత సమర్థవంతంగా మరియు బహిరంగ సముద్రంలో నిర్వహించడం సులభం చేసింది.

రాబోయే సీజన్ కోసం, వారు పిక్సెల్ 9 కు అప్‌గ్రేడ్ చేస్తున్నారు, ఇది మెరుగైన స్పీకర్ మరియు మైక్రోఫోన్ సామర్థ్యాలను జోడిస్తుంది మరియు అదే సమయంలో లోతైన అభ్యాస నమూనాలు మరియు నమూనా సరిపోలికను అమలు చేయడానికి తగినంత శక్తిని కలిగి ఉంటుంది.

తాజా చాట్ సిస్టమ్ హార్డ్‌వేర్ లోపల గూగుల్ పిక్సెల్ 9.

ఇతర గెమ్మల నమూనాల మాదిరిగానే, ఈ వేసవిలో డాల్ఫింగేమ్మను ఓపెన్ మోడల్‌గా తీసుకువస్తోందని గూగుల్ పేర్కొంది, “పరిశోధకులకు ప్రపంచవ్యాప్తంగా వారి స్వంత శబ్ద డేటాసెట్లను గని చేయడానికి ప్రపంచవ్యాప్తంగా సాధనాలను ఇవ్వండి, నమూనాల కోసం అన్వేషణను వేగవంతం చేస్తుంది మరియు ఈ తెలివైన సముద్ర క్షీరదాల గురించి మన అవగాహనను సమిష్టిగా మరింతగా పెంచుకోండి.”

గెమ్మ అనేది గూగుల్ అభివృద్ధి చేసిన తేలికపాటి పెద్ద భాషా నమూనాల కుటుంబం. తాజాది కుటుంబానికి అదనంగా గెమ్మ 3నాలుగు పరిమాణాలలో లభిస్తుంది: 1 బిలియన్, 4 బిలియన్, 12 బిలియన్ మరియు 27 బిలియన్ పారామితులు.




Source link

Related Articles

Back to top button