podstawy algebry liniowej do głębokiego uczenia

wprowadzenie
obiekty matematyczne
Zasady obliczeniowe
właściwości mnożenia macierzy
odwrotność i Transpozycja
podsumowanie
zasoby

wprowadzenie

Algebra liniowa jest ciągłą formą matematyki i jest stosowana w całej nauce i inżynierii, ponieważ pozwala modelować zjawiska naturalne i Oblicz je efektywnie. Ponieważ jest to forma matematyki ciągłej, a nie dyskretnej, wielu informatyków nie ma z nią dużego doświadczenia. Algebra liniowa jest również centralnym elementem prawie wszystkich dziedzin matematyki, takich jak geometria i analiza funkcjonalna. Jego koncepcje są kluczowym warunkiem zrozumienia teorii uczenia maszynowego, zwłaszcza jeśli pracujesz z algorytmami uczenia głębokiego. Nie musisz rozumieć algebry liniowej przed rozpoczęciem uczenia maszynowego, ale w pewnym momencie możesz chcieć lepiej zrozumieć, jak różne algorytmy uczenia maszynowego naprawdę działają pod maską.
to pomoże Ci podejmować lepsze decyzje podczas rozwoju systemu uczenia maszynowego. Więc jeśli naprawdę chcesz być profesjonalistą w tej dziedzinie, będziesz musiał opanować części algebry liniowej, które są ważne dla uczenia maszynowego. W algebrze liniowej dane są reprezentowane przez równania liniowe, które są przedstawione w postaci macierzy i wektorów. Dlatego najczęściej mamy do czynienia z macierzami i wektorami, a nie ze skalarami (omówimy te pojęcia w dalszej części). Kiedy masz do dyspozycji odpowiednie biblioteki, takie jak Numpy, możesz bardzo łatwo obliczyć złożone mnożenie macierzy za pomocą zaledwie kilku linii kodu. (Uwaga: ten wpis na blogu ignoruje pojęcia algebry liniowej, które nie są ważne dla uczenia maszynowego.)

obiekty matematyczne

Skalar

Skalar jest po prostu liczbą pojedynczą. Na przykład 24.

Wektor

wektor jest uporządkowaną tablicą liczb i może być w wierszu lub kolumnie. Wektor ma tylko jeden indeks, który może wskazywać określoną wartość w wektorze. Na przykład, V2 odnosi się do drugiej wartości w wektorze, która na powyższym rysunku wynosi -8.

macierz

macierz jest uporządkowaną dwuwymiarową tablicą liczb i ma dwa indeksy. Pierwszy wskazuje na wiersz, a drugi na kolumnę. Na przykład M23 odnosi się do wartości w drugim wierszu i trzeciej kolumnie, która jest 8 na żółtej grafice powyżej. Macierz może mieć wiele liczb wierszy i kolumn. Zauważ, że wektor jest również Macierzą, ale z tylko jednym wierszem lub jedną kolumną.

macierz w przykładzie na żółtej grafice jest również Macierzą 2 – na 3-wymiarową (wiersze x kolumny). Poniżej możesz zobaczyć inny przykład macierzy wraz z jej notacją:

tensor

możesz myśleć o tensorze jako tablicy liczb, ułożonej na regularnej siatce, ze zmienną liczbą osi. Tensor ma trzy indeksy, gdzie pierwszy wskazuje na wiersz, drugi na kolumnę, a trzeci na oś. Na przykład T232 wskazuje na drugi rząd, trzecią kolumnę i drugą oś. Odnosi się to do wartości 0 W prawym Tensorze na poniższym rysunku:

tensor jest najbardziej ogólnym terminem dla wszystkich powyższych pojęć, ponieważ tensor jest tablicą wielowymiarową i może być wektorem i Macierzą, w zależności od liczby indeksów, które ma. Na przykład Tensor pierwszego rzędu byłby wektorem (indeks 1). Tensor drugiego rzędu jest macierzą (2 indeksy), a tensory trzeciego rzędu (3 indeksy), a wyższe nazywane są Tensorami wyższego rzędu (3 lub więcej indeksów).

macierz-operacje skalarne

Jeśli mnożysz, dzielisz, odejmujesz lub dodajesz Skalar do macierzy, robisz to z każdym elementem macierzy. Poniższy obrazek doskonale ilustruje to do mnożenia:

macierz-mnożenie wektora

mnożenie macierzy przez wektor można traktować jako mnożenie każdego wiersza macierzy przez kolumnę wektora. Wyjście będzie wektorem, który ma taką samą liczbę wierszy jak macierz. Poniższy obraz pokazuje, jak to działa:

aby lepiej zrozumieć koncepcję, przejdziemy przez obliczenie drugiego obrazu. Aby otrzymać pierwszą wartość wektora wynikowego (16), bierzemy liczby wektora, który chcemy pomnożyć przez Macierz (1 i 5), i mnożymy je liczbami pierwszego rzędu macierzy (1 i 3). Wygląda to tak:

1*1 + 3*5 = 16

robimy to samo dla wartości w drugim wierszu macierzy:

4*1 + 0*5 = 4

i znowu trzeci rząd macierzy:

2*1 + 1*5 = 7

oto kolejny przykład:

And here is a kind of cheat sheet:

Matrix-Matrix Addition and Subtraction

Matrix-Matrix Addition and Subtraction is fairly easy and straightforward. Wymaganiem jest to, że macierze mają te same wymiary, a wynikiem jest macierz, która ma również te same wymiary. Po prostu dodajesz lub odejmujesz każdą wartość pierwszej macierzy z odpowiadającą jej wartością w drugiej macierzy. Zobacz poniżej: