En cliquant sur « Accepter tous les cookies », vous acceptez le stockage de cookies sur votre appareil afin d'améliorer la navigation sur le site, d'analyser l'utilisation du site et de contribuer à nos efforts de marketing. Voir notre Politique de confidentialité pour de plus amples renseignements.
Recherche
May 25, 2023

DataPerf : la nouvelle norme centrée sur les données pour le progrès de l'apprentissage automatique

Présentation des points de repère pour l'IA centrée sur les données : Comment l'IA coactive in the ML of data point.
Image décorative

What the fonctionne-t-elle bien in the bac to sable of development, puis échoue-t-elle dans la production réelle ? Parce que nous avons préparé pour réussir le test, et non pour préparer à la réalité, explique Will Gaviria Rojas, cofondateur de Coactive AI.

Pour que l'IA soit à la hauteur du battage médiatique, elle doit devenir fiable dans le monde réel. Plus de commentaires ? Il est temps de remanier les méthodes obsolètes de développement de ML, où les algorithmes sont itérés ad nauseam, mais les données statiques restent statiques. Nous allons nous concentré sur l'itération sur les données que nous avons utilisées pour former et tester les modélisations de ML, afin que l'IA puisse marcher lorsqu'elle quitte le laboratoire.

Dans ce blogue, nous dénonce :

  • les pièges du développement centré sur le modèle pour les solutions de ML concrètes
  • commentaire L'ia centrée sur les données peut fournir de meilleurs résultats dans le monde réel
  • DataPerf : le nouvel outil d'analyse comparative de l'industrie
  • we we provide a IA Verrally Overally Overally Overally for the entreprises

Si vous pensez que les données reignent in chef et que vous voulez bien déplier le ML dans le monde réel, lisez la suite pour découvrir ce dataPerf conduit le terrain vers l'IA centrée sur les données.

The problem : les points de repère de l'industrie sont trompeuses

Comme tout ingénieur en apprentissage automatique you the dira, il y a trois grandes marches for peaufiner un modèle d'apprentissage automatique : la formation, les tests et l'itération. Premièrement, les développeurs sélectionneront les données de formation et les introduiront dans leur modèle. Une fois la formation terminée, ils testent le rendement du modèle par rapport aux repères de l'industrie — des ensembles de données normalisés, comme ImageNet, CIFAR10 et OpenImages, que all other used in the all other used in the all all other not the all all the all all the time.

Le problème est que l'utilisation d'ensembles statiques de données d'essai n'est pas un moyen fiable d'évaluer le rendement réel d'un modèle. Il a fallu 15 ans pour que le premier outil d'apprentissage automatique atteigne l'honneur tant convoité et douteux de la « parité humaine ». Les algorithmes modernes peuvent maintenant prétendre atteindre cet objectif en une seule année. Mais ces résultats ont peu de rapport avec le rendement d'un algorithme dans le monde réel. En d'autres termes, le critère est brisé.

Imaginez que vous êtes un formateur olympique qui utilise uniquement les tapis roulants pour l'apprentissage des athlètes. Personne ne prendrais au sérieux si vous prétendiez que vos athlètes étaient prêts à remettre un décathlon. His, in that that industry, c'est exactement comme ça que nous avons développé nos outils de ML : the time time time, the time time time, then the be be enrouler in moment of déploiement.

Solution : DataPerf est la nouvelle référence de l'industrie en matière de performance de ML

Perf Data est le nouvel outil d'analyse comparative essentiel pour l'IA centrée sur les données. Il est composé de plusieurs outils interreliés par Coactive AI, en partenariat avec l'ETH Zurich, Google, l'Université Harvard, Landing.AI, Meta, Stanford University et TU Eindhoven.

Il est essentiel que les entreprises qui cherchent à utiliser des solutions d'apprentissage automatique puissent facilement faire la comparaison des performances de différents modèles, en particulier pour les petites entreprises, qui sont moins susceptibles d'avoir une expertise sur le terrain. DataPerf élève la barre pour l'ensemble de l'industrie du ML et apporte de la transparence pour les clients. In met in light the Experior Practices, this new reference peut stimuler l'innovation plus vite.

Pourquoi les ingénieurs devraient utiliser des méthodes d'IA centrées sur les données pour améliorer les résultats dans le monde réel

L'IA centrée sur les données comble l'écart de performance in inversant le processus traditionnel de développement de ML centré sur le modèle précédent. Au lieu de vous concentrer sur l'ajustement de votre modèle pour améliorer le rendement, vous efforcez de alimenter avec les ensembles de données d'entraînement triés et en constante évolution. This erreur est beaucoup plus représentative des scénario du monde réel et rend délibérément plus difficile pour votre modèle de répéter sa précision.

Imaginez que vous rendez dans un champ de tir à l'arc pour faire la cible. Avec l'IA centrée sur le modèle, you get get get of the best results, but is is not car your cible est statique. Grave to the centrée sur les données, you cibles est constamment en mouvement. Da that you frappez à plusieurs reviens the cible in arrière. That oblige your algorithme to s'entrerar plus fort and to remonter de niveau. C'est ainsi que l'approche centrée sur les données permet de progrès rapides et fournit des outils d'apprentissage automatique capables de gérer les complexités opérationnelles du monde réel.

Les entreprises doivent favoriser leurs données de formation

Laising of side the issues in industry reperes of industry, the entreprises ont toujours eu mal à mettre en œuvre les outils de ML en raison de leurs défis en matière de données. Une entreprise a Generally data of quality trop médiocre or trop of data for be soluted.

L'IA centrée sur les données est la solution à deux problèmes. Mettre l'accent sur la qualité des données plutôt sur la quantité peut offrir des outils de ML adaptés au monde réel.

Disons que votre entreprise a une usine qui fabrique des vis et que vous enlevez un outil de vision par ordinateur pour repérer les défauts de la chaîne de production. Conventionnellement, vous apprendrez le modèle sur un volume élevé d'images, sans tenir compte de leur pertinence. À la place de cela, you would you keep on qualité of your formation data.

This approche centrée sur les données profite également aux organisations confrontées à d'importants volumes de données, comme les constructeurs de véhicules autonomes ou les Plateforme UGC. Le traitement des grandes quantités de données est extrêmement cher et prend beaucoup de temps. But with the Ia centrée sur les données, vous n'avez pas besoin de traiter l'ensemble de données en entier.

Au lieu de ça, you would would organiser's sous-ensembles de données d'entraînement optimisées dont la complexité s'accentue peu à peu. De cette façon, vous avez la possibilité d'instruir votre modèle de ML, tout en le rendu suffisamment robuste pour faire face aux complexités du monde réel.

Il y a quelques techniques pour identifier les données de haute qualité. L'apprentissage actif, l'apprentissage des programmes d'études, la supervision inadéquate et la sélection des ensembles de base sont les plus courants. Mad new outils is in build for the report for a question of clics on the boutons for data analystes, plutôt que of a doctorat project. Si vous souhaitez identifier les données de formation optimales dans votre pool de données, nous vous aider.

Sommaire

The Last Object is of faire travailler côte à côte l'IA centrée sur le modèle et les données. But we we be be come the domaine of the IA centrée sur les données à maturité. Pour ce faire, nous avons co-créé DataPerf : un nouveau système d'analyse comparative pour améliorer la performance des outils d'apprentissage automatique dans des contextes réels.

Les principaux points à retenir for the Praticiens of ML and the entreprises qui cherchent à opéraliser l'IA sont les suivants :

  • Les méthodes de formation présentes pour le ML limitent ses compétences dans le monde réel, et les outils d'analyse comparative obsolètes masquent ses impasses
  • Les ingénieurs de ML devraient adopter une approche centrée sur les données ; cesser de se concentrer sur l'itération des modèles et privilégier plutôt l'utilisation de sous-ensembles de données de formation de haute qualité et de plus en plus complexes
  • DataPerf est la nouvelle référence de l'industrie qui permet aux développeurs et aux utilisateurs de ML de Comparer de manière plus transparente les performances probables des nouveaux formats

Si vous voulez faire partie d'une industrie du ML qui offre le rêve de l'IA opérationnelle, vous avez besoin d'un nouveau système d'analyse comparative. You avez besoin Perf Data.

CoactiveAI est très reconnue pour le soutien et l'expertise des cocréateurs de DataPerf, notamment l'ETH Zurich, Google, l'Université Harvard, Landing.AI, Meta, Stanford University et TU Eindhoven.

Vous voulez savoir plus sur la façon dont Coactive peut aider votre organisation à tirer parti de données d'images et de videos ? Screer un démo aujourd'hui, ou contactez-nous à info@coactive.ai.

L'IA coactive est le chef de fichier de l'industrie de l'apprentissage automatique centré sur les données. Nous sommes la meilleure solution de sa catégorie pour l'analyse de données d'images non structurées. Pour demander une démonstration de produit, entrer en contact. Ou si vous voulez aider à bâtir l'avenir, consultez notre offres d'emploi.