# 2: Maşın öyrənmə alqoritmləri haqqında nə bilmək lazımdır və niyə qayğı göstərməlisiniz

Bu 6 hissədən ibarət olan 2-ci hissədir, Maşın Öyrənmə Əsaslı Məhsullar Qurmaq üçün Addım-addım PM Təlimatı.

Daha əvvəl ML-nin sahib ola biləcəyi biznes növlərini müzakirə etdik. İndi məlumat elm qrupu ilə səmərəli işləmək və işinizə ən böyük təsir yaratmağa kömək etmək üçün bilmək lazım olan bütün texniki şərtləri nəzərdən keçirək (və ya ən azından danışdıqlarını bildiyiniz kimi səsləndirin).

Alqoritmlər, modellər və məlumatlar

Konseptual səviyyədə, müəyyən bir giriş dəsti verilənlərdə nümunələri tapmaq və ondan öyrənməklə müəyyən bir nəticə verəcək bir maşın qururuq.

Çox yaygın bir hal, bir maşının müəyyən bir giriş dəstinə və həmin girişlərə uyğun gələn bir dəstə baxaraq başlamasıdır. Aralarındakı nümunələri müəyyənləşdirir və daha sonra əvvəllər görmədiyi yeni girişlərə tətbiq oluna və istədiyiniz nəticəni verə biləcəyi kompleks qaydalar yaradır. Məsələn, kvadrat görüntülər, ünvan və otaqların sayı (giriş) nəzərə alınaraq bir evin satış qiymətini (çıxışı) proqnozlaşdırırıq. Deyək ki, 10 min evin kvadrat görüntüləri, ünvanı və otaqlarının sayı, eləcə də satış qiyməti barədə məlumatlarımız var. Maşın özü məlumatları "hazırlayacaq" - yəni kvadrat görüntülər, ünvan və otaqların sayı evin qiymətinə necə təsir etdiyini müəyyənləşdirən nümunələri müəyyənləşdirəcəkdir ki, əgər əvvəllər görmədiyi bir ev üçün bu 3 giriş verərsə, həmin evin qiymətini təxmin edə bilər.

Məlumat aliminin rolu verilənləri və gözlənilən nəticəni istifadə etmək üçün ən uyğun maşın tapmaqdır. Alqoritmlər deyilən maşınlar üçün çox sayda şablonu var. Müəyyən bir problemi həll etmək üçün həmin şablonlardan istehsal etdiyi maşınlara model deyilir. Şablonların eyni şablondan fərqli modellər hazırlamaq üçün çimdikləri fərqli variantları və parametrləri var. Ən yaxşı nəticələr verdiyini görmək üçün sınaya biləcəyi bir çox model yaratmaq üçün fərqli şablonlardan istifadə edə və / və ya eyni şablon üçün parametrləri çimdik edə bilər.

Qeyd edək ki, model çıxışı müəyyən dərəcədə ehtimal olunan qərar qəbul etmək üçün düzgün / faydalıdır. Modellər 100% düzgün deyil, lakin modelin gördüyü məlumatların miqdarını nəzərə alaraq "ən yaxşı təxminlər" dir. Model nə qədər çox məlumat görsə, faydalı nəticə vermə ehtimalı daha yüksəkdir.

Məlumat aliminin maşını “yetişdirmək” üçün istifadə etdiyi məlum girişlər və çıxışlar toplusu - yəni modelin məlumatlarındakı nümunələri müəyyənləşdirməsinə və qaydalar yaratmasına imkan verməsi - “təlim dəstidir”. Bu məlumatlar, elm adamlarının problemin həlli üçün işləyə biləcəyi bir və ya daha çox model yaratmaq üçün bir və ya daha çox "şablon" ilə istifadə olunur. Unutmayın ki, yalnız bir "şablon" (alqoritm) istifadə etsə də, fərqli parametrlərlə eyni şablondan birdən çox model yaratmaq üçün bəzi variantları düzəldə bilər.

Bu "öyrədilmiş" modellərdən bir neçəsinə sahib olduqdan sonra onların nə qədər işlədiyini və hansının daha yaxşı işlədiyini yoxlamaq lazımdır. "Doğrulama dəsti" adlı yeni bir məlumat dəsti istifadə edərək bunu edir. Qiymətləndirmə dəsti nəticələrinə ən yaxın olan nəticələrin verildiyini görmək üçün modelləri yoxlama dəsti girişlərində işlədir. Bizim nümunəmizdə - hansı model, evin satıldığı həqiqi qiymətə yaxın bir ev qiymətini proqnozlaşdıracaq. Bu mərhələdə ona yeni bir məlumat dəsti lazımdır, çünki modellər təlim dəsti ilə performanslarına görə yaradıldı, buna görə də həmin dəstdə yaxşı işləmək qərəzlidirlər və əsl oxumağa imkan vermirlər.

Hansı modelin ən yaxşısını etdiyini təsdiqlədikdən və qalib seçildikdən sonra məlumat alimimiz həmin modelin faktiki fəaliyyətini, yəni istehsal edə biləcəyi ən yaxşı modelin problemin həllində nə qədər yaxşı olduğunu müəyyənləşdirməlidir. Yenə də yeni bir məlumat toplusuna ehtiyac duyur, çünki model açıq şəkildə təlim və qiymətləndirmə dəstlərini yaxşı yerinə yetirir - belə seçildi! Son məlumatlar dəsti "test dəsti" adlanır. Təqdim etdiyimiz nümunədə ev qiymətlərinin sınaq dəsti üçün proqnozlaşdırılan ev qiymətlərinin sınaq dəstinin həqiqi ev qiymətlərinə nə qədər yaxın olduğunu yoxlayacaqdır. Ölçmə performansını daha sonra daha ətraflı müzakirə edəcəyik.

"Öyrənmə" növləri

Bir maşın öyrənmə problemini həll etmək üçün tətbiq edə biləcəyiniz alqoritm növü, əldə etdiyiniz məlumatlardan çox asılıdır. Öyrənmə alqoritmlərinin əsas təsnifatı onlardan istifadə edən modellərin qurulması üçün tələb olunan məlumatlara əsaslanır: Məlumatların həm giriş, həm giriş, həm də yalnız giriş daxil edilməli olub-olmaması, neçə məlumat nöqtəsinin tələb olunduğu və məlumatların toplandığı zaman. Buraya 4 əsas kateqoriya daxildir: Nəzarət olunan təlim, nəzarətsiz öyrənmə, yarı nəzarətli təlim və möhkəmləndirmə təhsili.

Nəzarət olunan öyrənmə

Əvvəlki hissədə ətraflı müzakirə etdiyimiz iş “nəzarətli təhsil” dediyimizi təsvir etdi. Bu, bir alqoritmin etiketli çox sayda məlumat nümunəsini - işləmək üçün həm girişdən, həm də müvafiq çıxışdan ibarət olan məlumatları görmək lazım olduğu bir öyrənmə növüdür. "Etiketli" hissə, misal üçün ev qiymətlərini, modelin proqnozlaşdırmağa çalışdığı nəticə ilə girişləri etiketləməyə aiddir.

Nəzarət olunan öyrənmə alqoritmləri etiketli məlumatları ("həqiqət" məlumatları) görür, ondan öyrənir və bu nümunələrə əsaslanaraq proqnoz verir. Onlar etiketli bir çox məlumat tələb edir: Sayı istifadə vəziyyətindən asılı olsa da, yüzlərlə məlumat nöqtəsi uzaqdan faydalı bir şey əldə etmək üçün çılpaq minimumdur.

Nəzarət olunan öyrənmə yolu ilə həll olunan iki klassik problem bunlardır:

  • Reqressiya. Bilinməyən bir dəyişənin dəyərini ağlabatan olduğu digər məlumatlara əsaslanaraq bu dəyişənə təsir edər. İki ümumi istifadənin vaxt proqnozu baxımından məqsədəuyğundur - məsələn, yer və kvadrat görüntülər kimi dəyişənlərə əsaslanaraq bir evin dəyərini proqnozlaşdırmaq və gələcək dəyərləri proqnozlaşdırmaq üçün əvvəlki nümunəmiz - məsələn, tarixi və cari ev dəyərinə əsaslanaraq bir il ərzində ev dəyərlərinin proqnozlaşdırılması. məlumatları. Reqressiya müstəqil dəyişənlər (əvvəlcədən əldə etdiyiniz məlumatlar) ilə proqnozlaşdırmaq istədiyiniz dəyəri dəyişən arasındakı əlaqəni müəyyənləşdirən statistik bir metoddur.
  • Təsnifat. Müəssisənin müəyyən kateqoriyadan hansı kateqoriyaya aid olduğunu müəyyənləşdirmək. Bu ikili təsnifat ola bilər - məsələn, yazıların viral keçəcəyini (bəli / yox) və çox etiketli təsnifatı - məsələn, məhsulun fotoşəkillərini məhsulun aid olduğu kateqoriyaya (bəlkə yüzlərlə kateqoriyadan) etiketləmək.

Təcrübəsiz öyrənmə

Təcrübəsiz öyrənilmədə alqoritm, verilənləri müəyyən edilmiş nəticəyə uyğun etiket etmə ehtiyacı olmadan məlumatların nümunələrini müəyyən etməyə çalışır. Məlumatlar "etiketlənməmişdir" - heç bir mənalı etiket olmadan "sadəcə" dir. Nəzarət olunmayan təlim metodları ilə həll olunan bir neçə klassik problem bunlardır:

  • Çoxluq. Müəyyən bir oxşarlıq meyarını nəzərə alaraq hansı maddələrin bir-birinə daha çox oxşar olduğunu tapın. Kümelenmənin istifadə olunduğu bir sahə mətndir - çox oxşar sənədləri qaytaran axtarış nəticələrini nəzərdən keçirin. Klasterləşdirmə onları bir-birinə qruplaşdırmaq və istifadəçinin ən fərqli sənədləri müəyyənləşdirməsini asanlaşdırmaq üçün istifadə edilə bilər.
  • Assosiasiya. Bəzi əlaqələrə əsaslanaraq cisimləri kovalara bölün, beləliklə bir kovada bir cismin digərinin olacağını proqnozlaşdırın. Məsələn, "satın alan insanlar ... satın aldılar ..." tövsiyə problemi: Çox sayda alış-veriş səbətini təhlil edərsə, X məhsulunun bir alış-veriş səbətində olması Y məhsulunun da alış-veriş səbətində olacağını göstərir dərhal məhsulu X məhsullarını səbətinə qoyan hər kəsə tövsiyə edə bilərsiniz.
  • Anomaliyanın aşkarlanması. Bayraqlanmalı və işlənməli olan məlumatlardakı gözlənilməz nümunələrin müəyyən edilməsi. Standart tətbiqlər mürəkkəb sistemlər üçün fırıldaqçılıq aşkarlanması və sağlamlıq monitorinqidir. (Qeyd: Nəzarət olunan anomaliya aşkarlama üsulları var, lakin nəzarətsiz üsulların istifadəsi çox yayılmışdır, çünki tərifinə görə anomaliyalar üçün etiketli məlumatları əldə etmək olduqca çətindir və bu nəzarət olunan texnikanın istifadəsi üçün vacib şərtdir.)

Yarı nəzarətli Öyrənmə

Bu alqoritm bəzi təlim məlumatlarını tələb etdiyi, nəzarət edilən və nəzarətsiz öyrənmə arasındakı hibriddir, lakin nəzarət edilən öyrənmə vəziyyətində (bəlkə daha az miqyaslılıq qaydası) olduğundan daha azdır. Alqoritmlər həm nəzarət edilən, həm də nəzarətsiz öyrənilmədə istifadə olunan metodların genişləndirilməsi ola bilər - təsnifat, reqressiya, çoxluq, anomaliya aşkarlanması və s.

Gücləndirmə öyrənmə

Burada alqoritm məhdud bir məlumat toplusu ilə başlayır və zamanla proqnozları barədə daha çox rəy aldıqca öyrənir.

Gördüyünüz kimi, həll etməyə çalışdığınız problemin növünə əlavə olaraq, əldə etdiyiniz məlumatların miqdarı istifadə edə biləcəyiniz təlim metodlarının növlərinə təsir edəcəkdir. Bu başqa bir şəkildə də tətbiq olunur - istifadə etməyiniz lazım olan təlim metodu, probleminizi effektiv şəkildə həll etmək üçün olduğunuzdan daha çox məlumat almağı tələb edə bilər. Bunu daha sonra müzakirə edəcəyik.

Bilmək lazım olan digər ümumi "Buzzwords"

Məkanda daha çox işləyərkən tez-tez qarşılaşacağınız bir neçə başqa termin var. Müzakirə etdiyimiz kateqoriyalarla əlaqələrini (və ya olmaması) anlamaq vacibdir.

Dərin öyrənmə yuxarıdakı təriflərə ortogonaldır. Sadəcə öyrənmə problemlərini həll etmək üçün müəyyən bir sistem növünün tətbiqi - həllinə nəzarət edilə bilər, nəzarətsiz və s.

Süni Neyron Şəbəkəsi (ANN) beynimizin işləməsini - qat şəklində qurulmuş "neyron" şəbəkəsi vasitəsilə simulyasiya etməyə çalışan bir öyrənmə sistemidir. Bir sinir şəbəkəsi ən azı bir giriş qatına malikdir - məlumatların şəbəkəyə ötürüldüyü neyron toplusu, bir çıxış qatı - nəticələri ötürülən neyronlar və "gizli təbəqələr" adlanan bir və ya daha çox təbəqə var. , hesablama işləri aparan təbəqələrdir. Dərin öyrənmə sadəcə bir təlim tapşırığını yerinə yetirmək üçün birdən çox gizli təbəqə olan neyron şəbəkələrin istifadəsidir. Heç belə şəbəkələrdən istifadə etmirsinizsə - təbriklər, qanuni olaraq buzzword ətrafında da ata bilərsiniz!

Ansambl metodları və ya ansambl öyrənmə, hər modelin fərdi olaraq əldə edə biləcəyindən daha yaxşı bir nəticə əldə etmək üçün birdən çox modelin istifadəsidir. Modellər fərqli alqoritmlərə və ya fərqli parametrlərə malik eyni alqoritmə əsaslana bilər. Fikir odur ki, daxil olan və çıxışı yaradan bir modelə sahib olmaq əvəzinə bir növ proqnoz söyləyin, hər birində bir proqnoz yaradan modellər dəsti var və fərqli nəticələrin ölçülməsi və nəticənin nə olduğuna qərar vermək üçün bəzi proseslər var. birləşdirilmiş qrup olmalıdır. Ansambl metodları tez-tez nəzarət olunan təlimdə istifadə olunur (proqnozlaşdırma problemlərində çox faydalıdır), lakin nəzarətsiz öyrənmədə də tətbiq oluna bilər. Məlumat elm qrupu, ehtimal ki, bu cür metodları sınayacaq və lazım olduqda tətbiq edəcəkdir.

Təbii dil emalı (NLP), maşınların dili ilə anlaşma ilə məşğul olan kompüter elmidir. Bütün NLP növləri maşın təlimindən istifadə etmir. Məsələn, bir "etiket buludu" - bir mətndə neçə dəfə göründüyünün əyani şəkildə əks olunduğunu meydana gətirsək - heç bir öyrənməyə ehtiyac yoxdur. Dil və mətnin daha mürəkkəb təhlili və anlaşılması çox vaxt ML tələb edir. Bəzi nümunələr:

  • Açar söz nəsil. Mətnin bir hissəsinin mövzusunu başa düşmək və bunun üçün avtomatik açar sözlər yaratmaq
  • Dil ayrılması. Bir sözün və ya cümlənin çoxsaylı mümkün təfsirindən müvafiq mənanın müəyyənləşdirilməsi (bu nümunələrlə əla izahdır)
  • Sentiment təhlili. Bir mətndə ifadə olunan mənfi müsbətə qarşı düşüncənin harada olduğunu anlamaq
  • Adlı müəssisə hasilatı. Bir mətndə şirkətləri, insanları, yerləri, markaları və s. Eyniləşdirmək; adlar bir-birindən fərqlənmədikdə bu xüsusilə çətindir (məsələn "Microsoft" şirkətini "Target" şirkətindən daha asan müəyyən etmək daha asandır, bu da ingilis dilində bir sözdür)

NLP, yalnız chatbotlar kimi ML-in dil yönümlü tətbiqləri üçün istifadə edilmir. Ayrıca bir çox ML modelinə faydalı bir giriş ola bilmədən əvvəl məlumatların hazırlanması və əvvəlcədən işlənməsi üçün geniş istifadə olunur. Daha sonra daha çox.

Xahiş edirik unutmayın: Yuxarıdakı təriflər əsas fikirləri çatdırmaq və praktik olmağa yönəldilmişdir; ətraflı elmi tərif üçün başqa mənbələrə müraciət edin.

Problemin həllinə necə təsir göstərir (və daha çox əsas ML anlayışları)

ML ilə əldə etməyə çalışdığınız strateji hədəf bir çox aşağı axın qərarlarını diktə edəcəkdir. Məlumat elm qrupunun işiniz üçün düzgün həll edə biləcəyinə əmin olmaq üçün bəzi əsas ML konsepsiyaları və onların iş məqsədlərinizə təsirini başa düşmək vacibdir.

Alqoritm seçimi

Problemin tərifində kiçik bir dəyişiklik onu həll etmək üçün tamamilə fərqli bir alqoritm tələb olunduğunu ifadə edə bilər və ya ən azı fərqli məlumat girişləri ilə fərqli bir model qurulacaqdır. İstifadəçilər üçün yaxşı işləyən fotoşəkillərin növlərini müəyyənləşdirməyə çalışan bir tanışlıq saytı, işləyən ümumi mövzuları müəyyənləşdirmək üçün klasterləşdirmə kimi nəzarətsiz öyrənmə texnikalarından istifadə edə bilər, halbuki problem müəyyən bir insana potensial tarixləri tövsiyə etmək üçün saytın giriş məlumatlarına əsaslanan nəzarətdən istifadə edə bilər. fərdi istifadəçi üçün, məsələn, artıq baxdıqları fotoşəkillər.

Xüsusiyyət seçimi

ML modelləri məlumatlardakı nümunələri müəyyənləşdirir. Modellərə bəslədiyiniz məlumatlar xüsusiyyətlərə bölünür (dəyişənlər və ya atributlar da deyilir): Bunlar, proqnozlaşdırmaq və ya müəyyənləşdirməyə çalışdığınız fenomenin bəzi tərəflərini təsvir edən müvafiq, əsasən müstəqil məlumat parçalarıdır.

Kredit müraciət edənlərə yardım etmək prioritetini axtaran bir şirkətin əvvəlki nümunəsini götürün. Problemi "müştərilərin çevrilmə ehtimalına görə prioritet" olaraq təyin etsək, oxşar müştərilərin şirkətin müxtəlif yayım fəaliyyətlərinə cavab dərəcəsi kimi xüsusiyyətləri daxil edəcəyik. Problemi "müştərilərin kreditlərini ödəməyə üstünlük verməsi" olaraq təyin etsək, müştərinin ödəmə ehtimalını qiymətləndirmək üçün əhəmiyyətsiz olduqları üçün bu xüsusiyyətləri daxil edə bilmərik.

Obyektiv funksiyanın seçimi

Obyektiv funksiya optimallaşdırdığınız və ya modelin proqnozlaşdırmağa çalışdığı nəticədir. Məsələn, bir istifadəçinin maraqlandığı məhsulları təklif etməyə çalışırsınızsa, bir modelin çıxışı, istifadəçi görsəydi məhsulu tıklayacağı ehtimalı ola bilər. İstifadəçinin məhsulu alması ehtimalı da ola bilər. Obyektiv funksiyanın seçimi ilk növbədə iş məqsədinizdən asılıdır - bu misalda, istifadəçi əlaqəsi ilə daha çox maraqlanırsınız, bu halda obyektiv funksiyanız klik etmək və ya qalmaq və ya birbaşa gəlir əldə edə bilər, bu halda obyektiv funksiyanız olacaqdır alış? Digər əsas məqam məlumatların mövcudluğu: Öyrənmək alqoritmi üçün, müsbət (etiketli) müsbət (istifadəçinin gördüyü və tıkladığı məhsullar) və ya mənfi (istifadəçinin gördüyü və gördüyü məhsullar) kimi çox məlumat nöqtəsini verməlisiniz. tıklamadı). Çox güman ki, satın alınan məhsullara qarşı tıklanmış (və ya tıklanmayan) məhsulların daha çox məlumat nöqtəsi sifarişinə sahib ola bilərsiniz.

İzahlı və izahlı

ML modellərinin çıxışı tez-tez bir sıra - bir ehtimal, bir şeyin baş verəcəyi və ya gerçək olduğu ehtimalının proqnozu. Məhsul tövsiyələri nümunəsində, saytdakı məhsullar, fərdi istifadəçinin onları tıklayacağı bir ehtimal təyin edilə bilər və ən yüksək ehtimalı olan məhsullar istifadəçiyə göstəriləcəkdir. Bəs bunun necə işlədiyini necə bilirsiniz? Bu vəziyyətdə alqoritmin işlədiyini yoxlamaq nisbətən asandır - yəqin ki, qısa bir sınaq keçirib baxa bilərsiniz. Ancaq sıraladığınız qurumlar potensial işçilərdirsə və modeliniz onların bir şirkət üçün yaxşı namizəd olma ehtimalını sınayırsa nə olacaq? Bir istifadəçi (deyək ki, işə götürən menecer) bunun üçün sözünüzü götürəcək, yoxsa alqoritm A şəxsini B şəxsindən əvvəl niyə sıraladığını başa düşməli olacaq?

Bir çox hallarda bunu izah etmək lazım olacaq. Bununla birlikdə, bir çox ML alqoritmləri qara bir qutudur: Bir çox xüsusiyyətləri daxil edirsiniz və izah etmək çətin olan bir model əldə edirsiniz. Dəzgahın məlumatlarda tapdığı naxışlar çox vaxt o qədər dözülməz olur ki, bir insan sözlə izah etmək asan olsaydı belə onları başa düşə bilməyəcəkdir.

Sonrakı hissələrdə izahlılığa ehtiyacın - son istifadəçinin nəticənin necə əldə olunduğunu başa düşməsi üçün nə dərəcədə və şərh edilməsinin - istifadəçinin nəticələrə əsasən müəyyən nəticələr çıxarmağının nə dərəcədə lazım olduğunu görürük. Modelləşdirmə, xüsusiyyətlər seçmə və nəticələrin təqdim edilməsinə yanaşmağınızda kritik bir düşüncə.

Modelləşdirmə və Performans Ölçmə zərərləri PM-ləri diqqətli olmalıdır

Məlumat alimləriniz, məlumatların işlənməsi və modelləşdirilməsi ilə bağlı bəzi ümumi problemlərlə məşğul olacaqlar, lakin onlarla məhsuldar söhbət etmək üçün PM-lərin bir neçə ümumi nöqsanları başa düşmələri faydalıdır. Tam siyahı deyil, ortaya çıxan daha çox yayılmış bəzi mövzuları da əhatə edir.

Üstünlük

Bir modelin məlumatları o qədər yaxından izlədiyi zaman məlumat daxilindəki həqiqi əsas əlaqəni deyil, səs-küyün çox olduğunu izah etdikdə "həddindən artıq uyğun" olduğu deyilir (təsvirə bax). Geniş danışsaq, hazırladığınız məlumatlarındakı modelin (modelin "öyrəndiyi" məlumatların) doğruluğu doğruladığınız və sınadığınız məlumatlardakı dəqiqlikdən qat-qat yaxşıdırsa, həddindən artıq uyğunlaşma hadisəsi ola bilər. .

Həddən artıq uyğun illüstrasiya

Həssaslıq, Xatırlamaq və Aralarındakı Ticarət

İlk dəfə eşitdiyiniz zaman çox çaşqın olan iki termin var, lakin aydın iş təsirləri olduğundan tam başa düşmək üçün vacibdir.

Təsnifatın düzgünlüyü (və sənədin alınması kimi digər tez-tez istifadə olunan ML texnikaları) tez-tez iki əsas ölçü ilə ölçülür: Dəqiqlik və geri çağırış. Dəqiqlik, alqoritm yaradılan bütün müsbət proqnozlardan həqiqi müsbət proqnozların payını, yəni düzgün proqnozların% -ni ölçür. Dəqiqlik X% olarsa, alqoritmin müsbət proqnozlarının X% -i həqiqi müsbətdir və (100-X)% -i yalnış pozitivdir. Başqa sözlə, nə qədər yüksək olarsa, o qədər də yalnış pozitiv olacaqsınız.

Xatırladaq ki, məlumatdakı bütün həqiqi pozitivlərdən müsbət proqnozların payıdır - yəni alqoritminizdəki məlumatlarındakı həqiqi pozitivlərin%% -ni pozitiv kimi müəyyənləşdirə bilməkdir. Əgər geri çağırış X% olarsa, məlumatdakı həqiqi pozitivlərin X% -i alqoritm tərəfindən pozitivlər, (100-X)% isə (saxta) mənfi kimi müəyyən edilmişdir. Başqa sözlə, nə qədər yalnış mənfi cəhətləri xatırlasanız.

Dəqiqlik və geri çağırış arasında həmişə bir ticarət var. Hər hansı bir yalan pozitiv istəmirsinizsə - yəni daha yüksək dəqiqliyə ehtiyacınız varsa, alqoritmdə daha çox saxta mənfi, yəni aşağı geri çağırışa sahib olacaqsınız, çünki bir şeyi müsbət olaraq etiketləməkdən daha çox mənfi kimi etiketləməyi "üstün tutur" və əksinə. Bu ticarət qərarı bir iş qərarıdır. Kredit müraciəti nümunəsini götürün: Yaxşı olar ki, etibarlı oynasın və qəbul olunmağa layiq olduğunuz yalnız abituriyentləri qəbul edəsiniz və bununla da bəzi yaxşı müştərilərin rədd olma şanslarını artırın (daha yüksək dəqiqlik, daha az geri çağırış = az saxta pozitiv, daha çox saxta mənfi tərəflər) , ya da rədd edilməli, lakin yaxşı müştərilərdən yayınma riski olmayan daha çox kredit müraciətçisini qəbul edin (daha yüksək geri çağırış, lakin daha dəqiqlik = daha az saxta mənfi, daha çox saxta pozitiv)? Bunun bir optimallaşdırma problemi olduğunu sadə bir şəkildə söyləyə bilsəniz, tez-tez müştəri hissləri (məsələn, əsassız rədd edilmiş müştərilər qəzəbli və səsli olacaq), marka riski (məsələn, anderrayter kimi nüfuzunuzdan asılıdır) asanlıqla ölçülə bilən amillər var. aşağı kredit defolt dərəcəsi), qanuni öhdəliklər və s., bu, məlumat elmi deyil, qərar qəbul etməkdir.

Tez-tez səhv edən Model Dəqiqlik Metrik

Yalnız model dəqiqliyi hər hansı bir model üçün yaxşı bir ölçü deyil. Əhali arasında 0,1% nisbətində bir xəstələnmə düşünün. Girişdən asılı olmayaraq heç bir xəstənin xəstəliyi olmadığını söyləyən bir model, 99.9% dəqiqdir, lakin tamamilə faydasızdır. Həmişə həm dəqiqliyi, həm də xatırlatmağı və iş ehtiyaclarına görə balanslaşdırmağı vacibdir. Mümkün nəticələrin paylanması kifayət qədər vahid olduqda və saxta pozitivlərin və yalan mənfi cəhətlərin əhəmiyyəti eyni dərəcədə olduqda düzgün bir metrikdir.

Orta ölçmə və balanssız təlim məlumatları

Bir modelin müraciət etməli olduğu bir çox seqmentlə qarşılaşdıqda, hər seqment üçün performans ölçümlərinə (və ya ən azı vacib olanlara) ayrıca baxmaq lazımdır. Məsələn, fotoşəkildə heyvan növünə görə bir sıra kateqoriyalardan birinə təsnif edən bir təsnifat modelini götürün. Modelin ümumi dəqiqlik / geri çağırış nömrələri bəzi kateqoriyaların böyük dəqiqliyə sahib olduğu bir vəziyyəti əks etdirə bilməz, bəzilərində isə çox aşağı dəqiqlik var. Bu, ümumiyyətlə təlim məlumatlarınızda bir balanssızlıq olduqda olur - deyin ki, pişik və itlərin 1000 etiketli fotoşəkili və yalnız 10 fotoşəkil ayısı var. Pişik və itlərin əksər fotoşəkilləri düzgün təsnif ediləcəyi üçün ümumi dəqiqliyiniz çox yüksək ola bilər, halbuki bütün ayılar səhv təyin olunur, çünki modeldə onlarla əlaqəli heç bir məlumat yoxdur. Daha az rast gəlinən kateqoriyalar sizin işiniz üçün vacibdirsə, modelinizin lövhədə yaxşı işləməsi üçün təlim məlumatlarını əldə etmək üçün razılaşdırılmış səy tələb oluna bilər.

Ok - bu olduqca uzun idi, amma inşallah indi bütün texniki əsasları yaxşı başa düşmüsünüz. Bundan sonra, bir düşüncə tərzindən istehsala başlamağa qədər bir model inkişaf etdirmək üçün ətraflı, addım-addım prosesə keçəcəyik.

Bu yazını maraqlı gördünüzsə, mənə bildirmək üçün aşağıdakı yaşıl ürək düyməsini vurmağı və ya faydalı hesab edə bilən biri ilə bölüşməyinizi xahiş edərsinizmi? Bu, mənim günümü tamamilə düzəldəcəkdir!