Метричний тензор: відмінності між версіями

м
робот косметичні зміни
м (Вилучення 19 інтервікі, відтепер доступних на Вікіданих: d:q757269)
м (робот косметичні зміни)
'''Метричний тензор''' — [[тензор]] другого рангу на гладкому [[многовид]]і, що задає його локальні властивості, зокрема визначає [[скалярний добуток]].
 
Метричний тензор використовується в [[загальна теорія відносності|загальній теорії відносності]] як [[метрика простору-часу]].
 
Величини, які стосуються геометрії - це відстані, довжини кривих, площі та об'єми (в тому числі <math>m</math>-вимірні об'єми) геометричних фігур, а також кути між векторами, прямими і т.д.
Розглянемо спочатку прямокутну декартову систему координат <math>\{x^1, x^2, \dots x^n \}</math> в <math>n</math>-вимірному просторі. Як відомо з аналітичної геометрії, квадрат відстані між двома точками <math>A</math> і <math>B</math> дається наступною формулою, яка є узагальненням теореми Піфагора:
: <math>(1) \qquad \big|AB \big|^2 = \sum_{i = 1}^n (x^i_B - x^i_A)^2 = (x^1_B - x^1_A)^2 + (x^2_B - x^2_A)^2 +
\dots + (x^n_B - x^n_A)^2</math>
де індексами внизу позначено, до якої точки дана координата відноситься.
 
Ми не можемо безпосередньо поширити формулу (1) на вимірювання довжин кривих (оскільки довжина залежить не тільки від положення двох крайніх точок, але і від положення усіх проміжних точок), а також для вимірювання всередині кривих многовидів (оскільки в них навіть не існує декартової системи координат). Але в обох цих випадках аналогічну формулу ми можемо написати для двох нескінченно близьких точок. Позначимо їх - точка <math>P</math> з координатами <math>\{x^1, x^2, \dots x^n \}</math> і точка <math>P'</math> з координатами <math>\{x^1 + d x^1, x^2 + d x^2, \dots x^n + d x^n \}</math>. Відстань між цими точками позначимо <math>d s</math>, тоді формула (1) в нових позначеннях (диференціалах) перепишеться так:
: <math>(2) \qquad d s^2 = \sum_{i=1}^n \left(d x^i \right)^2</math>
Якщо від прямокутної декартової системи координат перейти в будь-яку іншу, в загальному випадку криволінійну, то вид формули (2) як суми квадратів не збережеться. Позначимо координати нової системи <math>\{u^1, u^2, \dots u^n \}</math>. Тоді диференціали старих і нових координат пов'язані формулами:
: <math>(3) \qquad d x^i = \sum_{j = 1}^n {\partial x^i \over \partial u^j} d u^j \qquad d u^i = \sum_{j = 1}^n {\partial u^i \over \partial x^j} d x^j </math>
і для квадрат\а відстані (2) ми одержуємо квадратичну форму щодо диференціалів нових координат:
де коефіцієнти <math>g_{jk}</math> дорівнюють сумі:
: <math>(5) \qquad g_{jk} = \sum_{i=1}^n {\partial x^i \over \partial u^j} {\partial x^i \over \partial u^k}</math>
В формулах (3), (4) всі суми беруться по індексах, що повторюються в межах від першого (1) до останнього індекса (<math>n</math>). Тому для спрощення виду формул доцільно в цих формулах не писати знак суми (правило Ейнштейна). З використанням правила Ейнштейна формула (4) запишеться так:
: <math>(6) \qquad d s^2 = g_{ij} d u^i d u^j</math>
 
== Вимірювання відстані на многовиді, вміщеному в евклідовий простір ==
 
Нехай маємо <math>N</math>-вимірний евклідовий простір з координатами <math>\{x^1, x^2, \dots x^N \}</math>. Радіус-вектор точки позначимо через <math>\mathbf{r}</math>:
: <math>(7) \qquad \mathbf{r} = \{x^1, x^2, \dots x^N \}</math>
Розглянемо в цьому просторі <math>n</math>-вимірний многовид, заданий параметрично через <math>\{u^1, u^2, \dots u^n \}</math>. Точки многовида визначаються через деякі функції радіус-вектора від цих параметрів:
: <math>(8) \mathbf{r} = \mathbf{r}(u^1, u^2, \dots u^n)</math>
Тоді дві близькі точки многовида утворюють вектор зміщення:
: <math>(9) \qquad d \mathbf{r} = \mathbf{r}_i d u^i \qquad \left( \mathbf{r}_i = {\partial \mathbf{r} \over \partial u^i} \right)</math>
Тобто ми знову отримали формулу (6), але коефіцієнти даються іншими аніж (5) за виглядом, але аналогічними формулами:
: <math>(11) \qquad g_{ij} = (\mathbf{r}_i \cdot \mathbf{r}_j)</math>
Дійсно, розписавши скалярний добуток в (11) як суму попарних добутків компонент векторів <math>\mathbf{r}_i</math> і <math>\mathbf{r}_j</math>, ми одержимо (5), але кількість доданків буде взагалі кажучи більшою: <math>N \ge n</math>. Рівність досягається, коли многовид є евклідовим простором, який вміщено сам в себе.
 
== Перетворення при заміні координат ==
 
Нехай на многовиді задано ще одну (нову) систему координат <math>\{\hat u^1, \hat u^2, \dots \hat u^n \}</math>, координати якої ми позначимо шляпками, щоб відрізнити від старої системи координат. Ясно, що існує взаємно-однозначна відповідність між старою і новою системою координат через посередництво точок многовиду. А саме, набір якихось <math>n</math> чисел <math>\{u^1, u^2, \dots u^n \}</math> задає деяку точку <math>P</math> на многовиді, а ця точка <math>P</math> має координати <math>\{\hat u^1, \hat u^2, \dots \hat u^n \}</math> в новій системі координат. Цю відповідність ми можемо записати через набір функцій:
: <math>(12) \qquad \hat u^i = \hat u^i (u^1, u^2, \dots u^n)</math>
які виражають нові координати через старі. Оскільки ця відповідність взаємно-однозначна, то і навпаки, нові координати можна виразити через старі:
: <math>(13) \qquad u^i = u^i (\hat u^1, \hat u^2, \dots u^n) </math>
Ми вважатимемо ці функції диференційовними. Тоді диференціали цих координат (для двох нескінченно близьких точок) пов'язані формулами:
: <math>(14) \qquad d \hat u^i = {\partial \hat u^i \over \partial u^j} d u^j; \qquad
d u^i = {\partial u^i \over \partial \hat u^j} d \hat u^j</math>
Підставляючи (14) в (6), знаходимо:
: <math>(15) \qquad d s^2 = g_{ij} {\partial u^i \over \partial \hat u^k} {\partial u^j \over \partial \hat u^l} d \hat u^k d \hat u^l</math>
Цю ж формулу можна використовувати для обчислення кута між двома кривими в точці перетину. Для цього в (21) треба підставити дотичні вектори до цих кривих.
 
Далі, пошук найкоротшої кривої між двома точками многовиду приводить до рівняння [[Геодезична лінія|геодезичної лінії]], яке з очевидністю залежить лише від метричного тензора <math>g_{ij}</math> та його похідних по координатах. Геодезична лінія є аналогом прямої в евклідовому просторі. З відрізків геодезичних ми можемо конструювати трикутник та інші закнені і незамкнені ламані. Уміючи шукати кути між кривими за формулою (21), ми можемо визначити кути геодезичного трикутника, та як вони залежать від довжин сторін (формула (17) для геодезичних).
 
Далі, ми можемо обчислити площу паралелограма, що побудований на векторах <math>\mathbf{a}</math> і <math>\mathbf{b}</math>:
Аналогічно до [[Геодезична лінія|геодезичної лінії]], ми можемо розглядати [[мінімальні многовиди]] вищих розмірностей. Наприклад, ми можемо "натягнути" мінімальну двовимірну поверхню на трикутник, складений з відрізків геодезичних - і таким чином обчислити площу цього трикутника.
 
Далі, вимірюючи відрізки геодезичних, ми можемо говорити про відстань між двома віддаленими точками многовида. Користуючись поняттям відстані, ми можемо розглядати такі геометричні об'єкти як куля і гіперсфера всередині многовида з центром в якійсь точці цього многовида.
 
== Абстрактні многовиди ==
 
Оскільки метричного тензора виявляється достатньо, щоб обчислювати різні властивості фігур всередині многовида, ми можемо абстрагуватися від зовнішнього евклідового простору (розмірності <math>N \ge n</math>) і обмежитися тільки вивченням метричного тензора <math>g_{ij}</math> і його похідних: [[Символи Крістофеля|символів Крістофеля]] та тензора [[Тензор Рімана|внутрішньої кривини Рімана]]. Прикладом абстрактного розгляду многовиду є [[сферична геометрія]] та [[геометрія Лобачевського]].
 
== Обернений метричний тензор ==
 
Окрім метричного тензора <math>g_{ij}</math> ми можемо розглянути ще один тензор другого рангу <math>\delta^i_j</math> з одним верхнім та одним нижнім індексами. В старій системі координат <math>\{u^1, u^2, \dots u^n \}</math> координати цього тензора утворюють одиничну матрицю:
: <math>(26) \qquad \left(\delta^i_j \right) = \begin{bmatrix} 1 & 0 & \cdots & 0 \\ 0 & 1 & \cdots & 0 \\
\cdots & \cdots & \cdots & \cdots \\ 0 & 0 & \cdots & 1 \end{bmatrix}; \qquad \delta^i_j = \begin{cases} 1, & \mbox{if } i = j \\ 0, & \mbox{if } i \ne j \end{cases}</math>
Обчислимо координати цього одиничного тензора в новій системі координат <math>\{\hat u^1, \hat u^2, \dots \hat u^n \}</math>. Маємо за тензорними правилами:
: <math>(27) \qquad \hat \delta^i_j = \alpha^i_k \beta^l_j \delta^k_l = \alpha^i_k \beta^k_j = \delta^i_j</math>
оскільки матриці переходу між цими системами координат
: <math>(28) \qquad \alpha^i_j = {\partial \hat u^i \over \partial u^j}; \qquad \beta^i_j = {\partial u^i \over \partial \hat u^j}</math>
є взаємно оберненими матрицями. <br>
Формула (27) показує, що компоненти тензора <math>\delta^i_j</math> утворюють одиничну матрицю не лише в старій, а взагалі в будь-якій системі координат. Постає питання, які ще тензори ми можемо утворити, маючи метричний тензор <math>g_{ij}</math> і одиничний тензор <math>\delta^i_j</math>? Додавати ці тензори покомпонентно ми не можемо, оскільки вони по-різному змінюються при заміні координат. Звернемося до алгебри матриць. Маючи матрицю
: <math>(28) \qquad G = \left (g_{ij} \right ) = \begin{bmatrix} g_{11} & g_{12} & \cdots & g_{1n} \\
g_{21} & g_{22} & \cdots & g_{2n} \\ \cdots & \cdots & \cdots & \cdots \\ g_{n1} & g_{n2} & \cdots & g_{nn} \end{bmatrix}</math>
Можна перевірити, що з усіх таких функцій лише пряма пропорційність та обернена пропорційність утворюють тензор — тобто правильно змінюються при заміні координат:
: <math>(30) \qquad \hat g_{ij} = \beta^k_i \beta^l_j g_{kl} \qquad \hat G = B G B \qquad \hat G^{-1} = A G^{-1} A</math>
Ясно, що обернена матриця <math>G^{-1}</math> перетворюється за законами двічі контраваріантного тензора. Цей тензор прийнято позначати тією ж літерою <math>g^{ij}</math>, що і метричний тензор <math>g_{ij}</math>, але з двома верхніми індексами і називати оберненим метричним тензором. Із означення маємо:
: <math>(31) \qquad \left ( g^{ij} \right ) = G^{-1} \qquad g^{ik} g_{kj} = \delta^i_j</math>
 
== Жонглювання індексами ==
 
Метричний тензор разом зі своїм оберненим дозволяє встановити еквівалентність між коваріантними та контраваріантними тензорами. Це здійснюється за допомогою формули опускання індексів через згортку з метричним тензором, наприкдад:
: <math>(32) \qquad T_{i\;k}^{\;j} = g_{ks} T^{\;js}_i</math>
і піднімання індексів через згортку з оберненим метричним тензором, наприклад:
: <math>(35) \qquad g^i_j = g^{ik} g_{kj} = \delta^i_j</math>
Піднявши ще один індекс метричного тензора, ми прийдемо до оберненого метричного тензора:
: <math>(36) \qquad g^{ik} g^j_k = g^{ik} \delta^j_k = g^{ij}</math>
Із формул (35) і (36) ми бачимо, що з точністю до жонглювання індексів тензори <math>g_{ij}</math>, <math>\delta^i_j</math> і <math>g^{ij}</math> представляють один і той же тензор. Отже ми вчинили розумно, позначивши обернений метричний тензор <math>g^{ij}</math> тією ж буквою <math>g</math>, що і метричний тензор <math>g_{ij}</math>. Порівняємо формули піднімання двох індексів для довільного тензора <math>a_{ij}</math> і для метричного тензора <math>g_{ij}</math>:
: <math>(37) \qquad a^{ij} = g^{ik} g^{jl} a_{kl}; \qquad g^{ij} = g^{ik} g^{jl} g_{kl}</math>
 
Обчислимо спочатку коваріантну похідну одиничного тензора:
: <math>(39) \qquad \nabla_k \delta^i_j = \partial_k \delta^i_j + \Gamma^i_{ks} \delta^s_j - \Gamma^s_{kj} \delta^i_s =
0 + \Gamma^i_{kj} - \Gamma^i_{kj} = 0</math>
Як бачимо, що ця похідна дорівнює нулю завжди, не тільки для [[Символи Крістофеля|символів Крістофеля]], але і для загальнішого випадку коефіцієнтів [[Афінна зв'язність|афінної зв'язності]].
Перейдемо тепер до метричного тензора. В охоплюючому евклідовому просторі друга похідна <math>\mathbf{r}_{ij}</math> радіус-вектора <math>\mathbf{r}</math> розгладається на дотичну до многовида складову, і на ортогональну <math>\mathbf{b}_{ij}</math>:
: <math>(45) \qquad \nabla_k g^{ij} = \nabla_k \left ( \delta^i_s g^{sj} \right ) =
\delta^i_s \nabla_k g^{sj} = g^{ip} g_{ps} \nabla_k g^{sj} = g^{ip} \nabla_k \left ( g_{ps} g^{sj} \right )
= g^{ip} \nabla_k \delta^j_p = 0</math>
 
== Метричний тензор як образ многовида, та аналогія із задачами машинного зору ==
 
Метричний тензор <math>g_{ij}</math> можна розглядати як набір <math>N = {n (n+1) \over 2}</math> функцій від координат <math>\{ u^1, u^2, \dots u^n \}</math>. Оскільки ми можемо брати різні системи координат для одного й того ж многовида, то ми матимемо і різний набір функцій. Це еквівалентно тому, як ми можемо сфотографувати один і той самий предмет під різними ракурсами. В загальному випадку задача розпізнати на двох фотографіях один і той же об'єкт виявляється дуже складною для комп'ютера, універсальний алгоритм розпізнавання ще невідомий. Те ж із метричним тензором - маючи два набори <math>N = {n (n+1) \over 2}</math> функцій, ми не можемо відразу сказати, чи представляють вони один і той же многовид у різних системах координат.
Але у двох випадках цей аналіз виявляється нескладним.
 
=== Простір постійної кривини ===
Перший простий випадок — це простір постійної кривини, в якому [[Тензор Рімана|тензор Рімана]] пропорційний метричній матрьошці четвертого рангу з постійним коефіцієнтом пропорційності <math>K</math>:
: <math>(46) \qquad R_{ijkl} = K g_{ij, kl} = K \left (g_{ik} g_{jl} - g_{il} g_{jk} \right )</math>
Ми можемо перевірити для двох наборів функцій <math>g_{ij}(u^1, u^2, \dots u^n)</math>, і <math>\hat g_{ij}(u^1, u^2, \dots u^n)</math> чи задовольняють вони рівняння (46) з одним і тим же коефіцієнтом <math>K</math>. Продовжуючи аналогію з фотографіями, це еквівалентно, що ми маємо дві рівномірно засвічені фотографії, всі пікселі бітмапи дорівнюють одному і тому ж числу.
 
=== Мала деформація системи координат ===
Другий простий випадок - коли система координат зміщується на малий вектор <math>v^i</math>:
: <math>(47) \qquad \hat u^i = u^i + v^i</math>
Малість зміщення означає, що ми можемо розкласти функції метричного тензора в ряд Тейлора і обмежитися лінійним членом:
: <math>(48) \qquad \hat g_{ij} (\hat u) = \hat g_{ij} (u) + v^k \partial_k \hat g_{ij}</math>
звідки
: <math>(55) \qquad \delta g_{ij} = - \left (\nabla_i v_j + \nabla_j v_i \right )</math>
Ця формула застосовується для виводу [[Слабке гравітаційне поле|лінеаризованого рівняння Ейнштейна]] в теорії гравітації. Аналогом цього випадку в машинній обробці зображень є алгоритм [[Лінійне стеження|лінійного стеження]] за рухомими об'єктами по двох суміжних кадрах відеокамери. Дана аналогія лише концептуальна, формули виходять різні.
 
== Дивіться також ==
8688

редагувань