డాల్ఫిన్స్ ఏమి చెబుతున్నారో అర్థం చేసుకోవడానికి గూగుల్ డాల్ఫింగేమా, కొత్త LLM ను ప్రారంభించింది

రోజుల తరువాత జెమిని 2.5 ప్రో ప్రయోగాత్మక చేత నడిచే లోతైన పరిశోధనను ప్రారంభించడంగూగుల్ డాల్ఫింగేమా అనే కొత్త మోడల్తో మళ్ళీ తిరిగి వచ్చింది. ఈ పెద్ద భాషా నమూనా శాస్త్రవేత్తలకు “డాల్ఫిన్లు ఎలా సంభాషించాలో అధ్యయనం” మరియు “వారు ఏమి చెబుతున్నారో కూడా తెలుసుకోండి” అని సహాయపడుతుంది.
సంస్థ జార్జియా టెక్ మరియు ది పరిశోధకులతో కలిసి పనిచేస్తోంది వైల్డ్ డాల్ఫిన్ ప్రాజెక్ట్ (డబ్ల్యుడిపి)దాని వ్యవస్థాపకుడు డాక్టర్ డెనిస్ హెర్జింగ్ నేతృత్వంలో. WDP యొక్క ప్రాధమిక లక్ష్యం, మీరు బహుశా can హించినట్లుగా, సహజ ప్రవర్తనలు, సామాజిక నిర్మాణాలు, కమ్యూనికేషన్ నమూనాలు మరియు అడవి డాల్ఫిన్ల ఆవాసాలపై గమనించడం, డాక్యుమెంట్ చేయడం మరియు నివేదించడం, ప్రత్యేకంగా అట్లాంటిక్ మచ్చల డాల్ఫిన్ (స్టెనెల్లా ఫ్రంటాలిస్)“నాన్-ఇన్వాసివ్, దీర్ఘకాలిక క్షేత్ర పరిశోధన” ద్వారా.
సంవత్సరాలుగా, WDP డేటాను సేకరించింది, ఇది కొన్ని డాల్ఫిన్ శబ్దాలను ప్రవర్తనలతో పరస్పరం అనుసంధానించడానికి అనుమతిస్తుంది. ఉదాహరణకు:
- సంతకం ఈలలు (ప్రత్యేకమైన పేర్లు) తల్లులు మరియు దూడలు తిరిగి కలపడానికి ఉపయోగించవచ్చు
- పోరాటాల సమయంలో తరచుగా కనిపించే పేలుడు-పల్స్ “స్క్వాక్స్”
- కోర్ట్ షిప్ సమయంలో తరచుగా ఉపయోగించే “బజ్స్” క్లిక్ చేయండి లేదా సొరచేపలను వెంటాడుతుంది
గూగుల్ ప్రకారం, “డాల్ఫిన్స్ యొక్క సహజమైన, సంక్లిష్టమైన కమ్యూనికేషన్ను విశ్లేషించడం ఒక స్మారక పని, మరియు WDP యొక్క విస్తారమైన, లేబుల్ చేయబడిన డేటాసెట్ అత్యాధునిక AI కోసం ఒక ప్రత్యేకమైన అవకాశాన్ని అందిస్తుంది.”
అక్కడే డాల్ఫింగేమా వస్తుంది. సరళంగా చెప్పాలంటే, ఇది WDP యొక్క డేటాసెట్లో గూగుల్ అభివృద్ధి చేసిన AI మోడల్, ఇది డాల్ఫిన్ స్వరాలను మరింత నిర్వహించదగిన ఆడియో యూనిట్లుగా విచ్ఛిన్నం చేయడానికి గూగుల్ యొక్క స్వంత సౌండ్స్ట్రీమ్ టోకనైజర్ను ఉపయోగిస్తుంది.
సంక్లిష్ట సన్నివేశాలను అర్ధవంతం చేయడానికి రూపొందించిన ప్రత్యేకమైన మోడల్ ఆర్కిటెక్చర్ ద్వారా ఇవి నడుస్తాయి. మొత్తం సెటప్ సుమారు 400 మిలియన్ పారామితుల వద్ద ఉంది, ఇది పిక్సెల్ ఫోన్లలో స్థానికంగా నడపడానికి తగినంత తేలికగా ఉంటుంది, WDP పరిశోధకులు వారితో ఈ రంగంలో తీసుకువెళతారు.
ఇప్పుడు, సాంప్రదాయ యంత్ర అభ్యాస నమూనాల మాదిరిగా కాకుండా, డాల్ఫింగేమా పదాలు లేదా చిత్రాలలో వ్యవహరించదు; ఇది ఖచ్చితంగా ఆడియో-ఇన్, ఆడియో-అవుట్. ఇది సహజ డాల్ఫిన్ గాత్రాల సన్నివేశాలను తీసుకుంటుంది, పెద్ద భాషా నమూనాలు మానవ ప్రసంగాన్ని ఎలా అర్థం చేసుకుంటాయో ప్రేరణ పొందిన విధానాన్ని ఉపయోగించి వాటిని ప్రాసెస్ చేస్తుంది మరియు ఒక క్రమంలో తదుపరి శబ్దాన్ని అంచనా వేస్తుంది.
డాక్టర్ డెనిస్ హెర్జింగ్ దీనిని స్వయంప్రతిపత్తితో పోల్చారు, కానీ డాల్ఫిన్ ఈలలు, పేలుడు పప్పులు మరియు క్లిక్ రైళ్లు. ఈ శబ్దాలలో నమూనాలు, నిర్మాణం మరియు పురోగతిని గుర్తించడానికి ఇది శిక్షణ పొందింది, టెక్స్ట్-ఆధారిత మోడల్ సందర్భం ఆధారంగా ఒక వాక్యంలో తదుపరి పదాన్ని ఎలా అంచనా వేస్తుంది.
గూగుల్ డాల్ఫింగెమ్మతో పాటు రాకముందే, డబ్ల్యుడిపిలోని పరిశోధకుల బృందం డాల్ఫిన్లతో రెండు-మార్గం కమ్యూనికేషన్ యొక్క అవకాశాన్ని అన్వేషించడానికి చాట్ (సెటాసియన్ హియరింగ్ ఆగ్మెంటేషన్ టెలిమెట్రీ) ను ఉపయోగిస్తోంది. చాట్తో ఉన్న లక్ష్యం డాల్ఫిన్ భాష యొక్క పూర్తి సంక్లిష్టతను పగులగొట్టడం కాదు, పరస్పర చర్య కోసం సరళమైన, భాగస్వామ్య పదజాలం నిర్మించడం.
చాట్ చేత సృష్టించబడిన కొత్త, సింథటిక్ ఈలలను అనుబంధించడం ద్వారా సిస్టమ్ పనిచేస్తుంది, నిర్దిష్ట వస్తువులతో డాల్ఫిన్లు ఆనందించేలా కనిపిస్తాయి. సర్గాసమ్, సీగ్రాస్ లేదా పరిశోధకులు ఉపయోగించే కండువాలు వంటివి ఆలోచించండి.
ఈ సింథటిక్ ఈలలను పదేపదే వస్తువులతో అనుబంధించడం ద్వారా, డాల్ఫిన్లు ఆ వస్తువుల కోసం “అడగడానికి” శబ్దాలను అనుకరించడం ప్రారంభిస్తాయని ఆశ.
చాట్ గూగుల్ పిక్సెల్ 6 ను ఆపివేసింది, ఇది నిజ సమయంలో అధిక-నాణ్యత ఆడియో విశ్లేషణను నిర్వహించింది. ఆఫ్-ది-షెల్ఫ్ ఫోన్లను ఉపయోగించడం అంటే జట్టుకు కస్టమ్ గేర్ అవసరం లేదు. ఇది విషయాలను చిన్నదిగా, చౌకగా, మరింత సమర్థవంతంగా మరియు బహిరంగ సముద్రంలో నిర్వహించడం సులభం చేసింది.
రాబోయే సీజన్ కోసం, వారు పిక్సెల్ 9 కు అప్గ్రేడ్ చేస్తున్నారు, ఇది మెరుగైన స్పీకర్ మరియు మైక్రోఫోన్ సామర్థ్యాలను జోడిస్తుంది మరియు అదే సమయంలో లోతైన అభ్యాస నమూనాలు మరియు నమూనా సరిపోలికను అమలు చేయడానికి తగినంత శక్తిని కలిగి ఉంటుంది.
ఇతర గెమ్మల నమూనాల మాదిరిగానే, ఈ వేసవిలో డాల్ఫింగేమ్మను ఓపెన్ మోడల్గా తీసుకువస్తోందని గూగుల్ పేర్కొంది, “పరిశోధకులకు ప్రపంచవ్యాప్తంగా వారి స్వంత శబ్ద డేటాసెట్లను గని చేయడానికి ప్రపంచవ్యాప్తంగా సాధనాలను ఇవ్వండి, నమూనాల కోసం అన్వేషణను వేగవంతం చేస్తుంది మరియు ఈ తెలివైన సముద్ర క్షీరదాల గురించి మన అవగాహనను సమిష్టిగా మరింతగా పెంచుకోండి.”
గెమ్మ అనేది గూగుల్ అభివృద్ధి చేసిన తేలికపాటి పెద్ద భాషా నమూనాల కుటుంబం. తాజాది కుటుంబానికి అదనంగా గెమ్మ 3నాలుగు పరిమాణాలలో లభిస్తుంది: 1 బిలియన్, 4 బిలియన్, 12 బిలియన్ మరియు 27 బిలియన్ పారామితులు.