Google oferă meta-seturi de date gratuite cu algoritmi AI de învățare profundă și de învățare automată Few-Shot pentru o clasificare rapidă și eficientă a imaginilor în TensorFlow și PyTorch

Tehnologie / Google oferă meta-seturi de date gratuite cu algoritmi AI de învățare profundă și de învățare automată Few-Shot pentru o clasificare rapidă și eficientă a imaginilor în TensorFlow și PyTorch 2 minute citite

Google Pixel 5?



Google are a anunțat disponibilitatea mai multor seturi de date cuprinzând imagini naturale diverse, dar limitate. Gigantul căutării este încrezător că datele disponibile publicului vor conduce ritmul Învățarea automată și inteligența artificială reducând în același timp timpul necesar pentru antrenarea modelelor AI pe o cantitate minimă de date. Google numește noua inițiativă „meta-seturi de date gratuite”, care va ajuta modelele de IA să „învețe” mai puține date. „Few-Shot AI” de la companie este optimizat pentru a se asigura că AI învață noi clase doar din câteva imagini reprezentative.

Înțelegând necesitatea formării rapide a modelelor de AI și Machine Learning cu mai puține seturi de date, Google a lansat „Meta-Dataset”, o mică colecție de imagini care ar trebui să contribuie la reducerea cantității de date necesare pentru a îmbunătăți acuratețea algoritmilor. Compania susține că, folosind tehnici de clasificare a imaginilor cu câteva fotografii, modelele AI și ML vor obține aceleași informații din mult mai puține imagini reprezentative.



Google AI anunță un set de date meta: un set de date de seturi de date pentru învățarea în câteva momente:

Învățarea profundă pentru AI și învățarea automată a crescut exponențial de ceva timp. Cu toate acestea, cerința de bază este disponibilitatea datelor de înaltă calitate și prea mari în cantități mari. Cantitățile mari de date de antrenament adnotate manual sunt adesea dificil de procurat și uneori pot fi, de asemenea, nesigure. Înțelegând riscurile unor seturi de date mari, Google a anunțat disponibilitatea unei colecții de meta-date.



Prin ' Meta-Dataset: un set de date de seturi de date pentru a învăța să înveți din câteva exemple ”(Prezentat la ICLR 2020 ), Google a propus un nivel de referință la scară largă și diversificat pentru măsurarea competenței diferitelor modele de clasificare a imaginilor într-un cadru realist și provocator de câteva fotografii, oferind un cadru în care se pot investiga mai multe aspecte importante ale clasificării de câteva fotografii. În esență, Google oferă 10 seturi de date de imagini naturale disponibile public și gratuite. Aceste seturi de date cuprind ImageNet, CUB-200-2011, Ciuperci, caractere scrise de mână și doodle. Codul este public și include o caiet care demonstrează modul în care poate fi utilizat Meta-Dataset TensorFlow și PyTorch .



Clasificarea puțină lovitură depășește formare standard și modele de învățare profundă . Este nevoie de generalizare la clase complet noi în momentul testului. Cu alte cuvinte, imaginile folosite în timpul testării nu au fost văzute la antrenament. Într-o clasificare cu câteva fotografii, setul de antrenament conține clase care sunt complet disjuncte de cele care vor apărea la momentul testului. Fiecare sarcină de testare conține un set de suport a câtorva imagini etichetate din care modelul poate afla despre noile clase și o disjuncție set de interogări de exemple pe care modelul este rugat apoi să le clasifice.

Un Meta-Dataset este o componentă mare în care modelul studiază generalizarea la seturi de date complet noi , din care nu s-au văzut imagini cu nicio clasă la antrenament. Aceasta se adaugă provocării dificile de generalizare a noilor clase inerente în configurația de învățare cu câteva fotografii.

Cum ajută Meta-Dataset la învățarea profundă pentru modelele de AI și de învățare automată?

Meta-Dataset reprezintă cel mai mare nivel de referință organizat pentru clasificarea imaginilor cu seturi de date încrucișate, cu câteva fotografii până în prezent. De asemenea, introduce un algoritm de eșantionare pentru generarea de sarcini de diferite caracteristici și dificultăți, prin variația numărului de clase din fiecare sarcină, numărul de exemple disponibile pe clasă, introducerea dezechilibrelor de clasă și, pentru unele seturi de date, variind gradul de similaritate între clasele fiecărei sarcini.



Meta-Dataset introduce noi provocări pentru o clasificare cu câteva fotografii. Cercetările Google sunt încă preliminare și există multe terenuri de parcurs. Cu toate acestea, gigantul căutării a susținut că cercetătorii au succes. Unele dintre exemplele notabile includ utilizarea unui design inteligent sarcină condiționare , mai sofisticat reglarea hiperparametrului , la ' meta-bază 'Care combină beneficiile pre-antrenamentului și meta-învățării și, în cele din urmă, utilizării selectarea caracteristicilor să specializeze o reprezentare universală pentru fiecare sarcină.

Etichete Google