Dhiso Qaabka Luqadda Weyn ee adiga kuu gaar ah

"Mashiinku wuxuu yeelan karaa xusuus weyn, laakiin ma fekeri karo - ilaa aan baro." – Alan Turing. Moodooyinka AI ee casriga ah sida GPT-4 ama Llama waxay ku saleysan yihiin xog uruurin weyn iyo qaabab xisaabeed adag. Laakiin maxaa runtii ka dambeeya? Maqaalkan, waxaan ku eegaynaa qaybaha muhiimka ah ee loo baahan yahay si loo dhiso qaabka luqadda laga soo bilaabo eber.


Moodooyinka Luuqadaha Waaweyn (LLMs) waa shabakado neerfaha ah oo lagu tababaray tiro aad u badan oo qoraal ah. Xooggoodu waxay ku jirtaa awoodda ay u leeyihiin inay soo saaraan qoraal u eg bini'aadamka, soo koobaan nuxurka iyo qorista koodka. Xudunta moodooyinkani waa qaab-dhismeedka Transformer , kaas oo awood u siinaya inay qabtaan ku-tiirsanaanta qoraallada oo ay sameeyaan saadaalo guud.

Miisaanka la tiriyey ayaa u oggolaanaya qaabka in si gaar ah loo cadaadiyo, si wax ku ool ah looga gudbo caqabadaha qalabka. Kala-soocidda aqoontu waxay sidoo kale yaraynaysaa cabbirka cabbirka: moodeel weyni wuxuu aqoontiisa u wareejiyaa kala duwanaansho is haysta. Goyntu waxay meesha ka saartaa cabirrada aan la soo koobi karin, taasoo keenta qaab-dhismeed caato ah oo hufan iyada oo aan la hurin saxnaanta.

Mid ayaa isticmaali kara Qaabaynta Luuqadda Maqaarka si loo kordhiyo qoto dheer ee semantic. Qaabku waxa uu dib u dhisaa qoraalada aan dhamaystirnayn oo sidaas awgeed fahmaya ereyada warshadaha gaarka ah. Sidoo kale, Saadaasha Erayga Xiga waxaa loo isticmaali karaa luqadda farsamada ee warshadaha gaarka ah. Kahor inta aan la tababarin qaabka, qoraalka waa in loo beddelaa qaab ay shabakadaha neuralku ku fahmi karaan calaamadaynta , dhejinta , iyo codeeynta byte-ga .

Si loo magdhabo la'aanta xogta tababarka ee warshadaha gaarka ah, barashada wareejinta iyo kordhinta xogta macmalka ah ayaa la isticmaalaa. Qaybaha wax-soo-jeedinta ee caatada ah iyo isku-xidhka la hagaajiyay waxay la jaanqaadaan xogta gaarka ah ee warshadaha. Cunsurka muhiimka ah ee moodooyinka beddelka waa habka is-fiirsiga . Calaamad kasta waxaa lagu miisaamaa dhammaan calaamadaha kale ee jumlada, taasoo ka dhigaysa macnaha ereyga mid cad.

Tusaale ahaan, jumlad sida "Bisadii waxay ku boodey miiska sababtoo ah way gaajaysan tahay" waxay macnaheedu noqon kartaa "iyadu" waa bisadda. Qaabku waxa uu aqoonsanayaa isku xidhka noocan oo kale ah isaga oo u siinaya muhiimada erey kasta. Tani waxay ka caawinaysaa inay si fiican u fahmaan macnaha guud. Farsamaynta ayaa awood u siinaysa tusaalaha in uu barto ku tiirsanaanta adag iyo macnaha macnaha qoraalka dhexdiisa.

Moodooyinka horay loo tababaray waxay isku daraan aqoonta gudaha. Isku-dhafkan wuxuu kordhiyaa kala duwanaanta xogta wuxuuna awood u siinayaa tayada moodeelka sare inkastoo xogta deegaanka xaddidan tahay. Waxqabadka moodooyinka AI waxaa lagu qiimeeyaa iyadoo la adeegsanayo qiyaaso gaar ah: Miisaan-F1 iyo jahwareerku waxay cabbiraan tayada hawlaha habaynta qoraalka, halka waqtiga jawaabta iyo heerka khaladku ay si hufan u taagan yihiin ku habboonaanta la taaban karo.

La qabsiga joogtada ah ee qaab-dhismeedka sharci ee firfircoon ayaa lagu gaaraa iyada oo loo marayo waxbarashada xaddidan , taas oo, tusaale ahaan, si toos ah ugu dhexaysa tilmaamaha ilaalinta xogta qaabka AI iyadoo la adeegsanayo sir kala duwan . Nidaamyo la-qabsi karo oo qawaaniin ah iyo hab-habbooneysiin gaar ah oo domain-gaar ah ayaa noo oggolaanaya inaan uga jawaabno xeerarka cusub si dabacsanaan iyo dhaqso leh.

Talaabada ugu horeysa ee habka tababarka ee qaabka luqadda waa tababar hore . Qaabka waxa lagu quudiyaa tiro aad u badan oo qoraal ah oo aan habaysan si loo barto qaababka luqadda guud, qaab-dhismeedka jumlada iyo macnaha erayga. Inta lagu jiro habkan, qaabku wuxuu isku dayaa inuu saadaaliyo ereyada soo socda ee jumlada isaga oo aan diiradda saarin hawl gaar ah. Tani waxay abuurtaa nooc ka mid ah fahamka caalamiga ah ee luqadda.

Hagaajinta hagaajintu waa tillaabada labaad ee qaabka hore loo tababaray uu ku takhasusay hawl gaar ah. Waxaa lagu tababbaray tiro yar oo xog gaar ah, tusaale ahaan in laga jawaabo su'aalaha macaamiisha, kala soocida qoraallada ama abuurto warbixin kooban. Hagaajinta wanagsan waxay hubisaa in moodalku uu bixiyo jawaabo sax ah oo macquul ah oo ku saabsan aag codsi oo qeexan.

Tababarka LLM wuxuu u baahan yahay awood xisaabeed sare. Si geeddi-socodku u noqdo mid hufan, habab kala duwan oo hagaajin ah ayaa la isticmaali karaa. Tani waxay kuu ogolaaneysaa inaad kaydiso miisaanka moodada oo aad mar dambe ku shubto ama soo dejiso xuduudaha horay loo tababaray, oo la daabacay. LoRA (Laqabsiga Darajada Hoose) ayaa sidoo kale loo isticmaalaa hagaajinta hagaajinta oo leh dadaal xisaabeed yar.

Loop-barashada khadka tooska ah ayaa loo adeegsadaa horumarka joogtada ah iyo la qabsiga natiijooyinka cusub iyo shuruudaha. Tani waxay si joogto ah ula socotaa waxqabadka moodeelka, waxay falanqaysaa xogta cusub iyo jawaab celinta isticmaalaha, waxayna si toos ah u hagaajinaysaa moodalka haddii loo baahdo. Ilaalinta xogta iyo hufnaanta waxaa lagu hubiyaa iyadoo loo marayo farsamooyin gaar ah oo kala duwan iyo ka saarista isku xirnaanta aan loo baahnayn .

Qoraal Python oo si gaar ah loo qorsheeyay ayaa si hufan u tababari kara qaabka luqadda. Waxa kale oo ay ku soo rogi kartaa miisaanka dibadda ee qaabka horay loo tababaray. Qaabka waxaa loo habeeyay hawl gaar ah iyadoo la waafajinayo xog gaar ah. Ka dib markii tababarka la dhammeeyo, qoraalku wuxuu badbaadiyaa miisaanka la cusboonaysiiyay si ay u diyaar ahaadaan isticmaalka mustaqbalka.

a0aa20559d62cebe2e1991af1d9d15e0

Moodooyinka luqaddu waxay mar hore isbeddel ku sameeyeen warshado badan, laga bilaabo adeegga macaamiisha ilaa abuurista nuxurka. Iyada oo loo marayo tababbarka hore ee la beegsanayo iyo hagaajinta hagaajinta, moodooyinka waxaa loo habeyn karaa hawlo kala duwan oo kala duwan. Kuwa horumariya faham qoto dheer oo ku saabsan hababkan waxay abuuri karaan xalalkooda AI ee loo habeeyay waxayna si firfircoon u qaabeeyaan horumarka tignoolajiyada.

Dib u laabo