Въвеждащо ръководство за данни от времеви редове

„Времето“ е решаваща променлива, когато става въпрос за натрупване на данни. При анализа на времеви редове времето е важен елемент от данните.

Какво представляват данните от времеви редове?

Данните от времеви серии се отнасят до поредица от точки от данни, които са подредени във времето. Той въвежда зависимост на реда между набор от наблюдения. Времевите редове са повсеместни в днешния свят, управляван от данни. Тъй като всяко събитие следва стрелата на времето, ние сме в постоянно взаимодействие с различни времеви серии от данни.

Обикновено се приема, че динамичните редове се генерират на редовни интервали от време и се наричат ​​редовни времеви редове. Не е необходимо обаче данните в рамките на този времеви ред да се генерират на редовни интервали. Такива случаи обхващат нередовни времеви серии, където данните следват последователност във времето. Това означава, че измерванията може да не се извършват на редовни интервали. Данните обаче могат да се генерират на отделни интервали от време или като пакет. Тегленията от банкомат или депозитите по сметки са примери за нередовни времеви редове.

Технически, във времева серия една или повече променливи се променят за даден период от време. Ако една променлива варира във времето, тя се нарича едномерен времеви ред. Например, помислете за датчик, който измерва температурата на стаята всяка секунда. Тук във всеки момент (т.е. секунда) се генерира само едномерна температурна стойност. Напротив, когато повече от една променлива се променя с течение на времето, това се нарича многовариантна времева серия. Например, разгледайте банковата икономика. В такива случаи се използват многовариантни времеви редове, за да се разбере как промените в политиката на една променлива, като лихвата по репо, могат да повлияят на други променливи (т.е. изплащане на заем за търговски банки).

Данните от времеви редове намират своето приложение във всяка дисциплина, от финанси, геология, метеорология, производство до компютри, IoT, физически и социални науки. Използва се за проследяване на промените във времето, раждаемостта, смъртността, пазарните колебания, производителността на мрежата и много други приложения. Някои от основните му случаи на употреба включват мониторинг, прогнозиране и откриване на аномалии. Например, прогнозирането на времеви серии играе критична роля при определянето на популярността на системите за управление на бази данни. Фигурата по-долу показва нарастващата популярност на СУБД през годините (2019-2021) в график на времеви редове.

https://www.influxdata.com/time-series-database/

Ключови компоненти на времевите редове

Факторите, които влияят върху стойностите на едно наблюдение във времеви редове, се третират като техни ключови компоненти. Трите категории компоненти включват:

  • Тенденция или дългосрочни движения
  • Краткотрайни движения
  • Сезонни вариации
  • Циклични вариации
  • Случайни или неправилни движения
  • Тенденция

    Тенденцията на данните да се увеличават или намаляват за дълъг период от време се нарича тенденция или дългосрочен компонент. Въпреки това е важно да се отбележи, че движението нагоре или надолу не е задължително да бъде в една и съща посока за даден период от време.

    Тенденциите могат или да нарастват, да намаляват или да останат стабилни през различни периоди от време. Общата тенденция обаче винаги трябва да се равнява на възходящ, низходящ или стабилен модел. Такива тенденции на движение са очевидни в примерите като селскостопанска производителност, смъртност, произведени устройства, брой фабрики и др.

    Линеен и нелинеен тренд

    Начертаването на стойности на времеви редове спрямо времето върху графика разкрива типа тенденция въз основа на модела на групиране на данни. Ако клъстерът от данни е повече или по-малко около права линия, тогава тенденцията се нарича линейна тенденция. В противен случай моделът на клъстера от данни показва нелинейна тенденция, тъй като съотношението на промяната между две променливи не е стабилно или постоянно. Следователно такива тенденции се наричат ​​също криволинейни корелации.

    Краткосрочни движения

    Във времеви серии тези компоненти са склонни да се повтарят за определен период от време. Те имат неравномерни къси изблици и влияят на изследваните променливи. Двата вида категории при краткосрочно движение включват:

    Сезонни вариации

    Тези версии работят редовно и периодично за период от по-малко от една година. Те са склонни да имат подобен или почти същия модел през период от 12 месеца. Такива вариации стават част от времеви редове, ако данните се записват редовно, т.е. на час, ден, седмица, месец или тримесечие.

    Сезонните вариации са причинени от човека или естествено възникващи. Различните сезони или климатичните условия играят решаваща роля в такива вариации. Например растениевъдството зависи изцяло от сезоните. По подобен начин пазарът на чадър или дъждобран зависи от дъждовния сезон, докато продажбата на охладители и климатици достига своя пик през летния сезон.

      Какво означава споделяне на състоянието на фокуса на iPhone?

    Създадените от човека конвенции включват фестивали, партита и поводи като бракове. Такива краткосрочни събития се повтарят година след година.

    Циклични вариации

    Вариациите във времевите редове, които са склонни да действат за период от повече от една година, се наричат ​​циклични вариации. За бизнес един пълен период се счита за „бизнес цикъл“. Скокът или спадът в ефективността на бизнеса зависи от различни фактори като икономическа структура, управление на бизнеса и други взаимодействащи сили. Тези циклични бизнес вариации може да са редовни, но не периодични. Като цяло бизнесът преминава през четирифазен цикличен процес, включващ просперитет, рецесия, депресия и съживяване.

    Такива циклични вариации са неразделна част от модела на времевите серии, тъй като развитието на бизнеса разчита в голяма степен на генерираните „последователни точки от данни“.

    Случайни или неправилни движения

    Случайните компоненти причиняват значителна вариация в наблюдаваната променлива. Това са чисто нередовни колебания без определен модел. Силите са непредвидени, непредвидими и непостоянни по природа – например земетресения, наводнения, глад и други бедствия.

    Случайните събития, описани по-горе, се анализират с помощта на данните от изходните времеви серии, за да се справят по-добре със сценарии от реалния живот, които могат да възникнат в бъдеще.

    Видове времеви редове

    Данните от времеви редове могат да бъдат разделени на четири типа, детерминистични, недетерминистични, стационарни и нестационарни. Нека да разгледаме всеки вид в детайли.

    #1. Детерминистични времеви редове

    Детерминиран времеви ред може да бъде описан с аналитичен израз. Не включва случайни или вероятностни аспекти. Математически може да се изрази точно за всички времеви интервали от гледна точка на разширение в ред на Тейлър. Това е възможно, ако всички негови производни са известни в произволен момент от време. Тези производни изрично уточняват миналото и бъдещето по това време. Ако всички условия са изпълнени, е възможно точно да се предвиди бъдещото му поведение и да се анализира как се е държал в миналото.

    #2. Недетерминистични времеви редове

    Недетерминистичният времеви ред има произволен аспект, свързан с него, който предотвратява изричното му описание. Следователно аналитичните изрази не са достатъчно осъществими решения за изразяване на такъв времеви ред. Даден времеви ред може да е недетерминистичен поради следните причини:

  • Информацията, необходима за описанието му, не е налична в своята цялост. Въпреки че по принцип може да има данни, те не могат да се третират изрично като количествено измерими.
  • Процесът на генериране на данни е случаен по природа.
  • Поради случайния фактор, недетерминираните времеви редове се подчиняват на вероятностни закони. Следователно, данните се разглеждат в статистически термини – подразбиращите се данни се дефинират чрез вероятностни разпределения и средни стойности в различни форми. Това включва средства и мерки за дисперсия, т.е. дисперсии.

    #3. Стационарен времеви ред

    В стационарен времеви ред статистическите свойства като средна стойност, дисперсия и други не разчитат на времевия аспект. Стационарен времеви ред е по-лесен за прогнозиране, тъй като може да се твърди със сигурност, че неговите статистически свойства ще останат същите, както са били наблюдавани в миналото. Следователно различни статистически методи за прогнозиране се основават на аргумента, че времевият ред е почти стационарен. Това означава, че времевите редове могат да се разглеждат като стационарни в приближение чрез прилагане на прости математически трансформации.

    #4. Нестационарни времеви редове

    В нестационарна серия статистическите свойства се променят с времето. Следователно динамичните редове с тенденции или сезонност попадат в нестационарната категория, тъй като тенденцията и сезонността могат да повлияят на стойността на динамичните редове през различни интервали от време. Нестационарните времеви редове описват непредвидими данни, предотвратявайки тяхното моделиране или прогнозиране.

    https://www.oreilly.com/library/view/hands-on-machine-learning/9781788992282/15c9cc40-bea2-4b75-902f-2e9739fec4ae.xhtml

    Анализ и прогнозиране на времеви редове

    Анализът и прогнозирането на времеви редове са удобни инструменти за наблюдение, анализиране и изучаване на еволюцията и динамиката на жизненоважни процеси и обекти от различен вид. Нека разгледаме всеки един по-задълбочено.

    Анализ на времеви редове

    Анализът на времеви редове се определя като процес на анализиране на данните, събрани за определен период от време. Тук анализаторите на данни записват данни на постоянни интервали за определен период от време. Скоростта на наблюдение на данните, т.е. интервалът от време, може да варира от секунди до години.

    Данните от времеви редове описват променливите, които се проверяват, тъй като осигуряват подробен анализ на колебанията в определен период от време. Параметрите, необходими за анализ, могат да варират в различните области и дисциплини. Някои от примерите могат да включват:

    • Научни инструменти – Данни, записвани на ден
    • Търговски уебсайт – посещения на клиенти на ден
    • Фондов пазар – Стойности на акциите на седмица
    • Сезон – Дъждовни дни в годината

    За да се осигури последователност и надеждност, анализът на времевите редове работи върху голямо количество точки от данни. Добрият размер на извадката е фино представяне на автентичността на открита тенденция или модел.

      7 най-добри готови шаблона за фактури, които да използвате незабавно [Word, Notion]

    Освен това анализът на времевите редове също е подходящ за прогнозиране на бъдещи събития въз основа на записани минали данни.

    Прогнозиране на времеви редове

    Анализът на времеви редове позволява на организациите да идентифицират основната причина за колебанията в тенденциите във времето. С данни в ръка предприятията могат да проучват и проучват допълнително, за да разберат по-добре как да се справят с непознати тенденции и да прогнозират предстоящи събития. Компаниите обикновено използват техники за визуализация на данни, за да определят такива аномалии в данните.

    Прогнозирането на времеви редове се върти около два основни фактора:

  • Предвидете бъдещи събития въз основа на минало поведение на данните.
  • Да приемем, че предстоящите тенденции ще имат сходства с модела на минали данни.
  • При прогнозирането основната цел е по същество да се предскаже как точките от данни ще продължат да остават същите или ще варират в бъдеще. Ето няколко примера от различни индустриални сектори, за да разберете по-добре нюансите на анализа и прогнозирането на времеви редове.

    • Фондов пазар – Прогнозиране на цената на акциите при затваряне всеки ден.
    • Продажби – Прогнозирайте продажбите на продукти за магазин всеки ден.
    • Ценообразуване – Прогнозиране на средната цена на горивото всеки ден.

    Някои от често срещаните статистически техники, използвани за прогнозиране на времеви редове, включват проста подвижна средна (SMA), експоненциално изглаждане (SES), авторегресивна интегрирана подвижна средна (ARIMA) и невронна мрежа (NN).

    Данни от времеви редове в облака

    За да разкрият стойността на данните от времеви редове, предприятията трябва да могат бързо да съхраняват и заявяват данни. Компаниите на капиталовия пазар разчитат на големи обеми исторически и поточни данни, за да използват анализ на данни в реално време и да вземат въздействащи бизнес решения. Това може да включва прогнозиране на уязвимостта при цените на акциите, определяне на нетните капиталови изисквания или прогнозиране на обменните курсове. За да осигурят гъвкавост и да обработват данните безпроблемно, много фирми избират миграция на техните бази данни с времеви серии към облака.

    С миграцията на бази данни с времеви серии към облаци, организациите могат да получат достъп до неограничени ресурси при поискване. Той позволява на фирмите да използват стотици ядра, за да изпълнят задачата си, което максимизира пропускателната способност на мрежата без проблеми със забавянето.

    Базите данни с времеви редове в облачната инфраструктура са подходящи за натоварвания с интензивни изчисления. Това включва извършване на изчисления на риска в отговор на пазарните тенденции в реално време. Финансовите фирми могат да премахнат режийните разходи на центъра за данни и да се насочат към използването на ресурси, за да подобрят производителността на своите работни натоварвания.

    Облачни доставчици като AWS предоставят Времеви поток на Amazon, услуга за база данни за времеви серии, която позволява лесно зареждане, съхранение и анализ на набори от данни за времеви серии. Те предлагат съхранение за управление на натоварвания с интензивни транзакции, инструменти за анализ в реално време и функционалност за поточно предаване на данни за представяне на събития, когато и когато възникнат.

    Следователно облачната инфраструктура усилва и мащабира предимствата на данните от времеви редове.

    Приложения на времеви редове

    Моделите на времевите редове служат за две цели,

  • Разберете основните фактори, които са произвели определен модел от данни.
  • Въз основа на анализа напаснете модел за прогнозиране и наблюдение.
  • Нека да разгледаме някои от случаите на използване на приложенията на данни от времеви серии.

    #1. Времеви редове във финансовата и бизнес област

    Всички финансови, бизнес и инвестиционни решения се вземат въз основа на текущите пазарни тенденции и прогнози за търсенето. Данните от времеви редове се използват за обяснение, корелация и прогнозиране на динамичния финансов пазар. Финансовите експерти могат да изследват финансовите данни, за да дадат прогнози за приложения, които помагат за намаляване на риска, стабилизиране на цените и търговията.

    Анализът на времевите редове играе ключова роля във финансовия анализ. Използва се при прогнозиране на лихвените проценти, прогнозиране на волатилността на фондовите пазари и много други. Заинтересованите страни в бизнеса и политиците могат да вземат информирани решения относно производството, покупките, разпределението на ресурсите и да оптимизират своите бизнес операции.

    Този анализ се използва ефективно в инвестиционния сектор за наблюдение на нивата на сигурност и техните колебания във времето. Цената на сигурността може също да се наблюдава в краткосрочен план (т.е. запис на данни на час или ден) или в дългосрочен план (т.е. наблюдение, продължило през месеци или години). Анализът на времеви редове е полезен инструмент за проследяване на ефективността на дадена ценна книга, актив или икономическа променлива за продължителен период от време.

    #2. Времеви редове в медицинската област

    Здравеопазването бързо се налага като поле, управлявано от данни. В допълнение към финансовия и бизнес анализ, медицинската област значително използва анализа на времеви редове.

      Как да изстържете текст от изображение в Chrome

    Помислете за сценарий, който изисква синергия от данни от времеви серии, медицински съгласувани процедури и техники за извличане на данни при лечение на пациенти с рак. Такава хибридна рамка може да се използва, за да се използват функциите за извличане на характеристики от събраните времеви серии от данни (т.е. рентгенови изображения на пациента), за да се проследи напредъкът на пациента и реакцията към леченията, предоставени от медицинското братство.

    В сектора на здравеопазването извличането на изводи от постоянно променящите се времеви редове от данни е от критична стойност. Освен това напредналите медицински практики изискват записите на пациентите да бъдат свързани във времето за по-добра видимост на здравето на пациента. Също така, здравните параметри на пациента трябва да се записват прецизно на редовни интервали, за да има по-ясна представа за здравословното състояние на пациента.

    С усъвършенстваните медицински инструменти, излизащи на преден план, анализът на времеви редове се утвърди в сферата на здравеопазването. Разгледайте примерите по-долу,

    • ЕКГ устройства: Измислени устройства за наблюдение на сърдечните състояния чрез записване на електрическите импулси на сърцето.
    • ЕЕГ устройства: Устройства, използвани за количествено определяне на електрическата активност в мозъка.

    Такива устройства са позволили на практикуващите лекари да извършват анализ на времеви серии за по-бърза, ефективна и точна медицинска диагноза.

    Освен това, с навлизането на IoT устройства, като сензори за носене и преносими здравни устройства, хората вече могат да правят редовни измервания на променливите за здравето си с течение на времето с минимални входове. Това води до последователно събиране на зависещи от времето медицински данни както за болни, така и за здрави индивиди.

    #3. Времеви редове в астрономията

    Астрономията и астрофизиката са двете съвременни дисциплини, в които данните от времеви серии се използват значително.

    По същество астрономията включва начертаване на траектории на космически обекти и небесни тела и извършване на точни измервания за по-добро разбиране на Вселената отвъд земната атмосфера. Поради това изискване астрономическите експерти са опитни в обработката на данни от времеви редове, докато калибрират и конфигурират сложни инструменти и изучават интересни астрономически обекти.

    Данните от времеви редове отдавна се свързват с областта на астрономията. През 800 г. пр. н. е. данните за времевите редове на слънчевите петна са събирани на редовни интервали. Оттогава се използва анализ на времеви редове

    • Открийте далечни звезди въз основа на звездни разстояния,
    • Наблюдавайте космически събития като свръхнови, за да разберете по-добре произхода на нашата вселена.

    Данните от времеви редове в този случай се отнасят до дължините на вълните и интензитета на светлината, излъчвана от звезди, небесни тела или обекти. Астрономите постоянно наблюдават такива предавани на живо данни, за да открият космически събития в реално време, както и когато се случват.

    В последно време се появиха изследователски области като астроинформатика и астростатистика, които смесват различни дисциплини като извличане на данни, машинно обучение, изчислителна интелигентност и статистика. В тези нови изследователски области ролята на данните от времеви редове е да откриват и класифицират астрономически обекти бързо и ефективно.

    #4. Времеви редове при прогнозиране на времето

    Аристотел изучава широко метеорологичните модели, за да разбере по-добре причините и следствията, наблюдавани при промените във времето в древни времена. С напредването на дните учените започнаха да записват данни, свързани с времето, на инструменти като „барометър“, за да изчислят атмосферните променливи. Данните се събират на редовни интервали и се съхраняват на различни места.

    С течение на времето прогнозите за времето започнаха да се появяват във вестниците. Бързо напред към днешния ден и епоха, повсеместните станции за прогнозиране на времето са инсталирани в различни географски райони по света, за да събират точни метеорологични променливи.

    Такива станции имат усъвършенствани функционални устройства, които са свързани помежду си, за да събират и корелират данни за времето от различни места. Корелираните данни се използват за прогнозиране на метеорологичните условия във всеки момент в зависимост от изискванията.

    #5. Времеви редове в развитието на бизнеса

    Данните от времеви редове позволяват на предприятията да вземат бизнес решения. Това се постига, тъй като процесът анализира минали данни, за да извлече бъдещи събития и да хвърли светлина върху вероятните възможности. Моделът на минали данни се използва за извличане на следните параметри:

    • Растеж на бизнеса: За оценка на цялостното финансово и бизнес представяне и измерване на растежа, данните от времеви серии са най-подходящият и надежден актив.
    • Приблизителна тенденция: Могат да се използват различни методи за времеви редове за оценка на нововъзникващите тенденции. Помислете например за тези методи, които анализират наблюдения на данни за определен период от време, за да отразят увеличението или намаляването на продажбите на конкретно електронно устройство.
    • Разкрийте сезонните модели: Записаните точки от данни могат да разкрият колебания и сезонни модели, които биха могли да помогнат при прогнозирането на данните. Получената информация от данни играе ключова роля за пазарите, където цените на продуктите варират сезонно. Такива данни могат да помогнат на предприятията при по-добро планиране и разработване на продукти.

    Заключение 👨‍🏫

    В обобщение, данните от времеви серии могат да се разглеждат като характеристики на сложни точки от данни, събрани за постоянен период от време. Анализът, моделирането и прогнозирането на времеви редове се превърнаха в неразделна част от нашето ежедневие с появата на IoT джаджи, интелигентни домакински уреди и преносими устройства. Освен това данните от времеви редове намират своето приложение в различни области, включително здравеопазване, астрофизика, икономика, инженерство, бизнес и много други.