NumPy е гаечният ключ в инструментариума на всеки специалист по данни. Това е невероятно полезна библиотека за работа с данни и задължително умение за всички специалисти по данни, анализатори и инженери.
Ако искате да научите това търсено умение, прочетете, тази статия ще обясни какво е NumPy, защо е важно и най-добрите ресурси за учене.
Съдържание
Какво е NumPy?
NumPy означава Числен Python. Това е библиотека, създадена от Травис Олифант през 2005 г. и се използва за анализ на данни.
В основата на NumPy е масивът. Масивът е просто списък от стойности на данни. Този масив може да се използва за представяне на вектори. Той е много подобен на вградения в Python тип списък, но има една ключова разлика.
За разлика от списъците на Python, данните в NumPy се съхраняват в непрекъсната памет. Това означава, че стойностите се съхраняват една до друга в паметта. Това прави достъпа до стойностите по-бърз; Масивите NumPy са до 50 пъти по-бързи от списъците на Python за обичайни операции.
Подобно на списъците на Python, масивите могат да съхраняват други масиви като елементи. Това ви позволява да създавате по-сложни математически конструкции като матрици и масиви от по-висок ред. Масивите имат полезни методи за общи статистически операции като изчисляване на средна стойност, медиана и стандартно отклонение. Можете да ги модифицирате чрез разделяне, съединяване, оформяне и преоформяне.
Изисквания за използване на Numpy
- Инсталация на Python
- Пип инсталация
- IDE като VSCode или, в по-идеалния случай, базирана на Notebook IDE като Jupyter
- Познаване на Python
Прочетете също: Jupyter Notebook Въведение за начинаещи
Случаи на употреба
- Numpy се използва за задачи за наука за данни поради по-бързите си масиви вместо вградените списъци на Python.
- Може да се използва за решаване на проблеми с линейна алгебра, като се използват вградените функции.
- Използва се в машинното обучение поради бързото изчисляване на вектори и матрици.
- Използва се за генериране на произволни набори от данни, използвайки своите произволни статистически функции.
Курсове за изучаване на NumPy
По-долу са някои от най-добрите ресурси за изучаване на NumPy и Data Science. Повечето от тези ресурси предполагат известно познаване на Python. Ако все още не сте научили Python, ето нашия списък с най-добрите ресурси за изучаване на Python.
Предпоставки за задълбочено обучение: Стекът Numpy в Python
Този курс по Udemy предлага леко ръководство, което да ви подготви за задълбочено обучение с помощта на Python. Курсът ви учи как да използвате Numpy за векторни и матрични изчисления.
В допълнение, той обхваща Pandas, библиотека за работа с набори от данни в Python: Matplotlib (инструмент за визуализация на данни) и Scipy (библиотека за изчисляване на статистика в Python).
Курсът съдържа шест часа видео по заявка и след като го купите, получавате безплатен доживотен достъп до него. Включва сертификат. Преди да опитате този курс, трябва да сте запознати и да се чувствате добре с линейната алгебра и програмирането в Python.
Анализ на данни с Python: NumPy & Pandas Masterclass
Този изчерпателен курс ви учи как да анализирате данни с помощта на Pandas и NumPy. Методът включва 216 лекции, 3 статии и 2 ресурса за изтегляне. Това ви дава общо повече от тринадесет часа съдържание.
Започва, като ви представя NumPy и концепцията за масив, който е централният обект в NumPy. След това курсът ще ви научи да използвате Pandas, популярна и полезна библиотека за работа с набори от данни. И накрая, ще научите визуализация на данни с помощта на библиотеката Matplotlib.
Това, което прави този курс различен от повечето е, че прави уроците по-практични, като ви учи чрез ролева игра. Ще играете ролята на анализатор на данни в голяма мултинационална компания за търговия на дребно, като анализирате данните, събрани от различните й операции. Както се очакваше, курсът предполага известно познаване на Python, преди да започнете курса.
Python с NumPy за абсолютно начинаещи
Този курс е един от най-удобните за начинаещи курсове на NumPy. Докато се очаква да знаете Python, курсът представя NumPy от самото начало.
Започва, като ви запознае с масивите NumPy. Обяснява как се различават от списъците на Python и как са по-бързи и по-подходящи за наука за данни, инженерство и анализ.
Освен това ще научите всички различни неща, които можете да правите с тези масиви. Те включват, но не се ограничават до създаване на масиви, достъп до тях с помощта на индекси, нарязване и свързване, както и тяхното оформяне и преоформяне.
Този курс има два часа видео съдържание и се фокусира само върху Numpy. Можете да завършите това и да получите сертификат след седмица.
Въведение в NumPy
Този курс от DataCamp е подходящ за начинаещи в NumPy. Курсът е с продължителност около 4 часа и се състои от 13 добре направени видеоклипа и 49 упражнения, които да ви помогнат да затвърдите концепциите, които сте научили.
Това е част от курса Data Scientist, така че ако завършите други курсове в същия курс, ще спечелите своя сертификат DataCamp Data Scientist.
Що се отнася до съдържанието, то представя масиви и обяснява предимствата на използването им пред списъците в Python. След това ще научите техники за излъчване и векторизация, за да направите кода си по-бърз и по-ефективен. Ще практикувате операции с масиви върху набора от данни на Monet.
Simplilearn NumPy Урок
Този безплатен урок от Simplilearn обхваща основите на Numpy. Той е кратък и преминава направо към въпроса. Статията има минимални обяснения и е идеална, ако я използвате като справка или ако вече знаете какво е Numpy и какво правят различните функции.
В статията се съдържат и кодови фрагменти за илюстриране на използването на различни функции с примери. Идеално е, когато бързате и искате да научите Numpy за десет минути. Тъй като е статия, тя няма място за практикуване или набори от данни за използване.
Ще трябва сами да създадете среда за практика и да намерите набори от данни, от които да практикувате. Kaggle е добро място за търсене на набори от данни и създаване на тетрадки за практикуване на наука за данни.
W3Schools
Този урок от W3Schools е моят личен фаворит. Той е безплатен и изчерпателен, обхваща всички основи на NumPy и по-напреднали теми като генериране на произволни статистически разпределения и използване на универсални функции за прилагане на векторизация.
Общо урокът е 43 уеб страници с кратки, но адекватни обяснения и кодови фрагменти, които да се илюстрират с примери. В допълнение, w3schools идва с редактор за писане на вашите Numpy заявки и тест, където можете да тествате знанията си.
Всичко това не е задължително, но би помогнало за вашето обучение. Като се запишете в курса на Numpy срещу заплащане, можете да спечелите сертификат, който да добавите към автобиографията си.
Курс за скалиране
Този курс по Scaler е добре съставен. Състои се от шест модула, които обхващат въведение в NumPy, многомерни масиви, структури от данни, функции, излъчване и други различни концепции.
Общо има 32 урока с 5 часа и 33 минути видео съдържание. Има 26 предизвикателства, които да ви помогнат да приложите наученото и да затвърдите концепциите в ума си. След завършване на курса получавате сертификат.
Както се очаква, трябва да знаете езика за програмиране Python, преди да започнете курса. Второто задължително условие е IDE с Python и Numpy, инсталирани на вашата машина.
Ръководство за Numpy от Травис Олифант
Написана от създателя на Numpy, тази книга е предназначена да бъде справочник за тези, които вече познават Python, но биха искали да научат за Numpy и други инструменти.
В тази книга Травис Олифант обхваща не само как да използвате Numpy, но и как да го разширите с помощта на API. Това е може би най-задълбоченият и подробен ресурс за Numpy.
Вероятно е идеален за опитни потребители на Numpy, които искат разбиране на по-високо ниво за това как работи Numpy и подробно ръководство, за да могат да допринесат и да разширят библиотеката.
Ръководство за начинаещи на Numpy от Иван Идрис
Тази книга за Numpy е предназначена да бъде удобна за начинаещи. Предназначен е за учени, инженери, програмисти и анализатори, които вече са запознати с Python, но искат да разширят своя набор от умения, като поемат Numpy като допълнително умение.
Книгата обхваща инсталирането на Numpy, Matplotlib, Scipy и IPython на локалната машина. След това обхваща масивите и различните функции за масиви, предоставени ви. След това ще използвате библиотеката, за да извършвате матрични операции и да тествате кода си с Numpy.testing. Като цяло тази книга е изчерпателно ръководство за Numpy.
NumPy: От основно към напреднало от Karan Singh Bisht
Заглавието „NumPy от основно към напреднало“ казва всичко. Тази книга е предназначена да бъде лек наклон, който ще ви отведе от това да не знаете нищо за библиотеката до това да знаете как да използвате някои от нейните по-разширени функции.
Книгата обхваща основите, като например обяснение на това какво е масив, до преминаване към по-напреднали и под капака теми, като ефекти на кеша на процесора и жизнения цикъл на Ndarray. Той има за цел да ви даде солидна основа за по-нататъшна работа с машинно обучение с помощта на библиотеката Numpy.
Урок за FreeCodeCamp в YouTube
FreeCodeCamp придоби популярност напоследък като източник на висококачествени уроци за кодиране и разработка на софтуер. В неговия каталог с уроци е този изчерпателен урок за Numpy. Както всички негови уроци, той е достъпен безплатно.
Урокът е около час и обхваща основите на Numpy. Това е нежно въведение в библиотеката, предназначено да не бъде непосилно за тези, които току-що са започнали. Както бихте очаквали, знанията за Python се предполагат преди гледане на видеоклипа.
Заключителни думи
Numpy е невероятно полезен и многофункционален. Това е очакван инструмент за повечето научни и инженерни работни места. Тази статия ви запозна с Numpy и ви даде абстрактен преглед на високо ниво на основните му концепции.
Освен това статията изброява ресурси, които могат да бъдат полезни в пътуването ви към изучаването на Python. Краткото описание на всеки ресурс успя да ви помогне да направите информиран избор кой да изберете.
След това вижте най-добрите библиотеки на Python за специалисти по данни.