Научете R и станете специалист по данни

Популярността на езика за програмиране R нараства, особено в науката за данни и анализа.

Тъй като предоставя по-добри техники за визуализация на данни, R програмиране играе решаваща роля в статистиката.

Изучаването на този език обаче може да бъде разочароващо, ако нямате ясен път към него. В миналото може да сте се борили много, докато сте учили R или друг език.

Вярвай ми; не си сам!

Не обвинявайте изцяло себе си или езика; проблемът може да е бил във вашия подход. Начинът, по който научавате нещо, оказва огромно влияние върху постигането на крайния резултат.

Ако имате ясна стратегия за това как и защо трябва да научите определен език, шансът да го владеете се увеличава. По същия начин, ако вашата цел и стратегия не съвпадат, може да се отегчите от езика и в крайна сметка да го напуснете по средата.

Това е аналогично на изучаването на говорим език.

Така че, когато сте готови да научите R, изяснете мотива си на първо място, било то разширяване на знанията ви или намиране на кариера в науката за данни. След това изгответе стратегия и я съобразете с целта си.

…И започнете да учите.

В тази статия ще говоря за някои добри ресурси за изучаване на езика за програмиране R, които ще ви дадат правилния подход за улесняване на нещата.

Но най-напред,

Какво представлява езикът за програмиране R?

R е език за програмиране с отворен код за графики и статистически изчисления.

Разработен е през 1993 г. от Рос Ихака и Робърт Джентълман. Той е подобен на езика за програмиране – S. Може да се каже, че езикът за програмиране R е имплементация на S, комбинираща лексикална семантика на обхвата. Софтуерът е написан основно на C, R и Fortran.

R предлага голямо разнообразие както от статистически, така и от графични техники в допълнение към това, че е силно разширяем. Включва класическо статистическо тестване, линейно и нелинейно моделиране, анализ на времеви серии, групиране и класификация.

Една от основните силни страни на езика R е лесното създаване на добре проектиран сюжет с качество на публикация, включително математически формули и символи.

Възможностите на Р

R е вид интегриран пакет, състоящ се от софтуерни съоръжения, които можете да използвате за изчисляване, графично представяне и манипулиране на данни.

Включва:

  • Ефективно съоръжение за съхранение и обработка на данни
  • Интегрирана, съгласувана и голяма колекция от инструменти за анализ на данни
  • Набор от различни оператори, полезни при изчисляване на масиви в конкретни матрици
  • Прост, ефективен и добре разработен език за програмиране с цикли, условни условия и дефинирани от потребителя променливи
  • Графични средства за анализиране на данни и показването им на хартиен носител или на екрана
  • R може да се разширява чрез пакети. Всъщност около 8 пакета се доставят с помощта на R дистрибуция, докато повече могат да бъдат добавени със семейството сайтове CRAN.
  • Междуплатформена оперативна съвместимост
  • Вместо да използва компилатор, R използва интерпретатор, който улеснява разработването на код.
  • Той се асоциира добре с различни бази данни и носи информация от MS Access, Excel, MySQL, Oracle, SQLite и др.
  • Той интегрира мощни инструменти за предаване на отчети в различни форми като HTML, XML, CSV, PDF и интерактивни сайтове с R пакети.
  • R пакетите идват с различни кодове, функции и функции, пригодени за статистическо моделиране, анализ на данни, машинно обучение, визуализация, импортиране на данни и манипулиране.

Как R помага при анализа на данни?

Анализът на данни с помощта на R се извършва в поредица от различни стъпки:

  • Програмиране или импортиране: Програмиране с R или можете да импортирате данни от бази данни и файлове в софтуерната среда R
  • Трансформация: Организацията на данните се осъществява чрез трансформиране на колона в променлива по време на ред в наблюдение. Наблюдавайте интересите си, създайте нова променлива като функция на текущите променливи и открийте статистики за наблюдение.
  • Визуализация: представяне на данни в графична форма за лесно разпознаване на тенденции, модели и изключения от данни.
  • Модели: Това са допълнителни инструменти за визуализация като изчислителни или математически инструменти за отговор на въпроси, свързани с наблюдение.
  • Комуникация: Комуникация на резултатите с другите, направо от визуализация до моделиране, с помощта на лесни за производство графики с качество на печат, които да споделяте с всеки по света.
  26 най-добрия софтуер за 3D моделиране

Кой използва R и защо?

На R се доверяват не само академичните среди, но и големи компании, включително Google, Facebook, Airbnb, Uber и др. Използва се в здравеопазването, консултациите, правителството, застраховането, енергетиката, финансите, медиите, почти навсякъде. Те го използват за статистически изводи, алгоритми за машинно обучение и анализ на данни.

Виждате ли, търсенето на R е в различни сектори. В допълнение към това анализът на данни несъмнено оформя съвременния бизнес. Въпреки че има много налични инструменти, R се откроява. Това е така, защото може да имате:

  • Excel и PowerBI, но им липсва възможност за моделиране;
  • Python е чудесен за AI и ML, но няма комуникационни функции;
  • SAS е добър за статистически анализи, но не е безплатен
  • Tableau е отличен за графични представяния, но трябва да се справи по-добре при вземането на решения и статистиката.

R обаче запълва празнината, като предлага отлична крива на обучение с добър баланс на внедряване и анализ на данни.

Следователно има смисъл да научите R за манипулиране и анализ на данни и дори да станете учен по данни.

Ето защо специалистите по данни използват R, за да разбират данни, да извършват манипулации, да направят най-добрия подход и да комуникират с другите чрез отчети, табла за управление или уеб приложения. По този начин една платформа изпълнява цялата работа.

Сега знаете как работи R и защо трябва да го използвате, но къде да научите R?

Толкова ли е трудно да се научи?

Ако ми зададохте тези въпроси преди няколко години, щях да отговоря с „да“, малко е трудно поради сложната си структура. Но сега се въвеждат пакети за преодоляване на този проблем, което направи манипулирането на данни по-лесно и интуитивно, а създаването на графики е доста лесно.

Пакети като TensorFlow и Keras ви позволяват да създавате ML техники от висок клас; можете да извикате Python, C++ и Java в R и да се свържете с Hadoop или Spark. И R се е развил и по отношение на изчислителната скорост.

И така, искаш ли да научиш R?

Приемам ДА!

Нека намерим някои добри ресурси, за да научим R.

Учен по данни с Р

Придобийте R умения, които могат да ви помогнат да изградите кариерата си като Data Scientist Datacamp. За да започнете курса, не са ви необходими предварителни познания или опит в тази област.

Те ще ви научат на универсалния език R и как можете да го използвате за импортиране, манипулиране, визуализиране и почистване на данни, които са основните интегрални умения, от които се нуждаете. С интерактивни упражнения придобийте практически опит с известни R пакети като ggplot2 заедно с Tidyverse пакети като readr и dplyr.

Курсът също така ще ви запознае с някои набори от данни от реалния свят, които ви помагат да научите машинно обучение и статистически техники, необходими за самостоятелно писане на функции и провеждане на клъстерен анализ.

Всичко, което трябва да направите, е да започнете този курс, да развиете R умения и да продължите пътя си, за да станете успешен специалист по данни. Те предлагат над 75 часа учебни ресурси. Включва въвеждане на езика за овладяване на основите на анализа на данни с типични структури от данни като матрици, вектори, рамки от данни и др.

R Програмиране AZ

Udemy предлага R Programming AZ с практически упражнения, които да ви помогнат да станете специалист по данни. Курсът е разделен на 8 секции, 82 лекции и отнема приблизително 11 часа за завършване.

Те ви учат на R стъпка по стъпка и ще научите ценни концепции, които са приложими веднага след всяка лекция. И друго страхотно нещо е, че ви учат на концепции с помощта на живи примери. Цялото обучение е пълно с аналитични предизвикателства от реалния свят, които ще решавате по време на лекцията и упражнението за домашна работа.

  Звуков еквалайзер за всички и всички музикални приложения на вашия iPhone [Jailbreak]

Всеки с каквито и да било умения може да научи този курс, но трябва да научите езика R и да поемете вълнуващи предизвикателства. Материалът на курса ви учи на неговите основни принципи и как да създавате променливи, вектори, цикли и функции.

Ще научите и за нормалното разпределение и практика с финансови данни, статистически данни и спортни данни. Освен това ще научите как да използвате R Studio и да го персонализирате според вашите предпочитания.

В края на този курс ще инсталирате R пакети и ще разберете големи числа, цели числа, двойни числа, знаци и други. Курсът включва и усъвършенствана визуализация с помощта на GGPlot2 заедно с решения за домашна работа и бонус уроци.

Статистика с Р

Coursera предлага този курс – Статистика с R специализация, за да ви помогне да овладеете R за анализ на данни, включително моделиране, изводи и байесови техники. Този курс е напълно БЕЗПЛАТЕН и се предлага от университета Дюк.

Този курс ще придобие умения като статистически изводи, линейна регресия и статистика, RStudio, R програмиране, проучвателен анализ на данни, статистическо тестване на хипотези, байесова статистика, байесова линейна регресия, байесов извод, регресионен анализ и избор на модел.

Специализацията ще ви научи как да визуализирате и анализирате данни на езика за програмиране R и след това да създавате възпроизводими отчети. Ще се научите да показвате статистически изводи в тяхната единна природа и да изпълнявате моделиране и други техники, за да вземате решения, базирани на данни.

Курсът също ще ви помогне да комуникирате правилно резултатите, да организирате и визуализирате данни с помощта на R пакети и да критикувате решения и твърдения. Ще ви помогне да изградите портфолиото си с различни проекти за анализ на данни, за да демонстрирате своите знания и умения в допълнение към намирането на високоплатена работа.

Този курс за начинаещи отнема приблизително 7 месеца за завършване, включва гъвкав график, пълни онлайн лекции и сертификат за споделяне след завършване.

Първи стъпки с R

Друг курс от Coursera в този списък е – Първи стъпки с R.

Това е курс за начинаещи, който отнема около 2 часа за завършване и имате достъп до него само от вашия работен плот, без да е необходимо изтегляне. Този ръководен проект ви учи на основите на програмирането на R, за да направите първата си стъпка към анализа на данни.

Тук ще научите как да използвате R Studio или R GUI и различните структури и типове данни, използвани в този език. И накрая, те ще ви научат как да инсталирате R пакетите и да импортирате вашите набори от данни в работното пространство на R Studio.

Няма необходимите предпоставки за завършване на този проект; само основни компютърни познания са достатъчни. В ръководения проект вашето работно пространство ще бъде облачен работен плот, до който имате достъп от вашия браузър. Вашият инструктор ще ви води на разделен екран чрез видеоклип, за да ви накара да разберете нещата стъпка по стъпка.

Udacity

Научете R програмиране, за да бъдете специалист по данни Udacity. Приблизителното време, което отнема този курс, е 3 месеца с 10 часа усилия всяка седмица и не се нуждае от трудни предпоставки.

Учебната програма включва обучение как да кодирате в R, команден ред, SQL и Git, за да можете да решавате проблеми, свързани с данни. Ще научите основите на SQL като JOIN, подзаявки и агрегати и ще ги използвате, за да отговаряте на бизнес проблеми.

Научете основите, включително структури от данни, цикли, функции и променливи. В допълнение към него ще научите как да визуализирате данни чрез GGPlot2.

Програмата включва проекти от реалния живот със завладяващо съдържание, разработено от експерти, подкрепа от ментори и кариерни услуги като прегледи на автобиография и портфолио. Учете по собствен график и получете персонализирана обратна връзка, практически съвети и допълнителни предложения за повече ресурси.

  Как да вградите чертеж от Google в Google Docs

ML Учен с Р

Овладейте езика R, за да станете уверен учен с машинно обучение Datacamp. Те предлагат общо 15 курса с 60+ часа усилия за изучаване на R. Тук; ще подобрите своите набори от R умения с кутия с инструменти и ще извършвате неконтролирано и контролирано обучение.

Те ще ви научат как да обработвате данни за създаване на модел, да обучавате и визуализирате моделите и да тествате тяхната ефективност. В допълнение към това, вие ще помогнете да настроите параметрите им, за да постигнете по-добра производителност.

Междувременно ще научите и байесова статистика, Spark и обработка на естествен език (NLP). Те ще ви научат на основите на машинното обучение за класификация, как можете да предвидите бъдещи събития чрез линейна регресия, произволни, гори, xgboost и адитивни модели.

Освен това ще научите размерност, групиране, ML в Tidyverse, логистична регресия, клъстерен анализ, ML с каретка, дърво-базирани модели, опорни векторни машини, тематично моделиране, настройка на хиперпараметри и др.

Анализ на данни с R

Edureka предлага програмата за обучение – Анализ на данни с R за да ви помогнем да придобиете опит в манипулиране на данни, визуализация, проучвателен анализ на данни, копаене, анализ на настроенията и регресия.

Обучението може също да ви помогне да научите R Studio за казуси в социалните медии и търговията на дребно. Те са проектирали този курс, за да предложат уменията и знанията, необходими, за да станете професионалист по анализ на данни. Той обхваща основни R концепции до напреднали теми, като ансамбъл от дърво на решенията, съвместно филтриране и др.

Модулите ви превеждат през важни терминологии като бизнес разузнаване, данни и информация, бизнес анализи и др. Ще научите методи за импортиране на данни, проучвателен анализ на данни, групиране, линейна и логистична регресия, контролирани ML техники, ANOVA, R пакети, създаване на графики и много други, заедно с работата по проекта.

За да вземете този курс, имате нужда от основни познания по статистика. Той включва 30 часа онлайн класове, където ще получавате практически задачи за изпълнение след всеки клас, заедно с доживотен достъп до курса с презентации, записи на класове, ръководства за инсталиране и тестове. Вземете сертификат при завършване на курса.

YouTube

Научете R на YouTube с Бартън Поулсън, който преподава основите на езика R и статистическите изчисления.

Урокът обхваща теми като как да инсталирате R, неща за R Studio, функция за графика, пакети, хистограми, лентови диаграми, точкови графики, функция за обобщение, наслагване на графики и функция за описание.

Той също така учи как да избирате случаи, фактори, формат на данните, как да въвеждате данни, импортирате данни, концепциите за йерархично групиране, регресия, главни компоненти и др.

Codecademy

Codecademy ви запознава с основните концепции на езика за програмиране R. Няма специфични предпоставки за изучаване на този курс или необходими познания по кодиране.

Тук ще научите как да организирате данни, да ги модифицирате и да почиствате рамките с данни. Те също така ще ви научат да създавате визуализации на данни и да показвате прозрения. В допълнение към това ще научите тестване на хипотези и статистика, за да превъзхождате в областта на анализа на данни.

Учебната програма на курса също така включва основите на агрегатите и свързващите таблици с dplyr; изчисляване на режим, средна стойност и медиана; и статистики като квартили, интерквартилен диапазон и квантили.

Можете също да тествате знанията си чрез тестове, за да изострите синтаксиса и паметта. Завършването на курса отнема около 20 часа, а с Pro плана можете да спечелите сертификат.

Datamentor

Datamentor курсът включва неограничен достъп до 45+ видеоклипа, интерактивни задачи, електронна книга R Essentials и проект.

Той ви запознава с основите на науката за данните, нейните процеси и различните стъпки, които трябва да предприемете, за да изпълните задача за наука за данни, като получаване на данни, изследване, моделиране и предаване на отчета.

Заключение

С много налични ресурси изучаването на езика за програмиране R вече не е трудна задача. Всичко, от което се нуждаете, е да имате страст към ученето и силно желание да се впуснете в областта на науката за данни.

И така, амбициозен професионалист в науката за данни ли сте? 💡

Научете R с помощта на гореспоменатите невероятни курсове.