From SU(1,1) to the Lorentz group

From the two-dimensional disk we are moving to three-dimensional space-time. We will meet Einstein-Poincare-Minkowski special relativity, though in a baby version, with x and y, but without z in space. It is not too bad, because the famous Lorentz transformations, with length contraction and time dilation happen already in two-dimensional space-time, with x and t alone. We will discover Lorentz transformations today. First in disguise, but then we will unmask them.
[latexpage]
First we recall, from The disk and the hyperbolic model, the relation between the coordinates $(x,y)$ on the Poincare disk $x^2+y^2<1$, and $(X,Y,T)$ on the unit hyperboloid $T^2-X^2-Y^2=1.$ [caption id="attachment_3054" align="aligncenter" width="640"] Space-time hyperboloid and the Poincare disk models[/caption]

\begin{eqnarray}
X&=&\frac{2x}{1-x^2-y^2},\\
Y&=&\frac{2y}{1-x^2-y^2},\\
T&=&\frac{1+x^2+y^2}{1-x^2-y^2}.
\label{eq:XYT1}\end{eqnarray}

\begin{eqnarray}
x&=&\frac{X}{1+T},\\
y&=&\frac{Y}{1+T}\label{eq:Xx1}.
\end{eqnarray}

We have the group SU(1,1) acting on the disk with fractional linear transformations. With $z=x+iy$ and $A$ in SU(1,1)
\begin{equation}A=\begin{bmatrix}\lambda&\mu\\ \nu&\rho\end{bmatrix},\end{equation}
the fractional linear action is
\begin{equation}A:z\mapsto z_1=\frac{\rho z+\nu}{\mu z+\lambda}.\end{equation}
By the way, we know from previous notes that $A$ is in SU(1,1) if and only if
\begin{equation}\nu=\bar{\mu},\,\rho=\bar{\lambda},\quad|\lambda|^2-|\mu|^2=1.\end{equation}

Having the new point on the disk, with coordinates $(x_1,y_1)$ we can use Eq. (\ref{eq:XYT1}) to calculate the new space-time point coordinates $(X_1,Y_1,T_1).$ This is what we will do now. We will see that even if $z_1$ depends on $z$ in a nonlinear way, the space-time coordinates transform linearly. We will calculate the transformation matrix $L(A),$ and express it in terms of $\lambda$ and $\mu.$ We will also check that this is a matrix in the group SO(1,2).

The program above involves algebraic calculations. Doing them by hand is not a good idea. Let me recall a quote from Gottfried Leibniz, who, according to Wikipedia

He became one of the most prolific inventors in the field of mechanical calculators. While working on adding automatic multiplication and division to Pascal’s calculator, he was the first to describe a pinwheel calculator in 1685[13] and invented the Leibniz wheel, used in the arithmometer, the first mass-produced mechanical calculator. He also refined the binary number system, which is the foundation of virtually all digital computers.


“It is unworthy of excellent men to lose hours like slaves in the labor of calculation which could be relegated to anyone else if machines were used.”
— Gottfried Leibniz

I used Mathematica as my machine. The same calculations can be certainly done with Maple, or with free software like Reduce or Maxima. For those interested, the code that I used, and the results can be reviewed as a separate HTML document: From SU(1,1) to Lorentz.

Here I will provide only the results. It is important to notice that while the matrix $A$ has complex entries, the matrix $L(A)$ is real. The entries of $L(A)$ depend on real and imaginary parts of $\lambda$ and $\mu$

\begin{equation}\lambda=\lambda_r+i\lambda_i,\, \mu=\mu_r+i\mu_i.\end{equation}

Here is the calculated result for $L(A)$:

\begin{equation}L(A)=\begin{bmatrix}
-\lambda_i^2+\lambda_r^2-\mu_i^2+\mu_r^2 & 2 \lambda_i \lambda_r-2 \mu_i \mu_r & 2 \lambda_r \mu_r-2 \lambda_i \mu_i \\
-2 \lambda_i \lambda_r-2 \mu_i \mu_r & -\lambda_i^2+\lambda_r^2+\mu_i^2-\mu_r^2 & -2 \lambda_r \mu_i-2 \lambda_i \mu_r \\
2 \lambda_i \mu_i+2 \lambda_r \mu_r & 2 \lambda_i \mu_r-2 \lambda_r \mu_i & \lambda_i^2+\lambda_r^2+\mu_i^2+\mu_r^2
\label{eq:a2l}\end{bmatrix}\end{equation}

In From SU(1,1) to Lorentz it is first verified that the matrix $L(A)$ is of determinant 1. Then it is verified that it preserves the Minkowski space-time metric. With $G$ defined as
\begin{equation}G=\begin{bmatrix}-1&0&0\\0&-1&0\\0&0&1\end{bmatrix}\end{equation}
we have
\begin{equation}L(A)GL(A)^T=G.\end{equation}
Since $L(A)_{3,3}= \lambda_i^2+\lambda_r^2+\mu_i^2+\mu_r^2 =1+2|\mu|^2\geq 1>0,$ the transformation $L(A)$ preserves the time direction. Thus $L(A)$ is an element of the proper Lorentz group $\mathrm{SO}^{+}(1,2)$.

Remark: Of course we could have chosen $G$ with $(+1,+1,-1)$ on the diagonal. We would have the group SO(2,1), and we would write the hyperboloid as $X^2+Y^2-T^2=-1.$ It is a question of convention.

In SU(1,1) straight lines on the disk we considered three one-parameter subgroups of SU(1,1):

\begin{eqnarray}
X_1&=&\begin{bmatrix}0&i\\-i&0\end{bmatrix},\\
X_2&=&\begin{bmatrix}0&1\\1&0\end{bmatrix},\\
X_3&=&\begin{bmatrix}i&0\\0&-i\end{bmatrix}.
\end{eqnarray}
\begin{eqnarray}
A_1(t)&=&
\exp(tX_1)=\begin{bmatrix}\cosh(t)&i\sinh(t)\\-i\sinh(t)&\cosh(t)\end{bmatrix},\\
A_2(t)&=&
\exp(tX_2)=\begin{bmatrix}\cosh(t)&\sinh(t)\\ \sinh(t)&\cosh(t)\end{bmatrix},\\
A_3(t)&=&
\exp(tX_3)=\begin{bmatrix}e^{it}&0\\ 0&e^{-it}\end{bmatrix}.
\end{eqnarray}

We can now use Eq. (\ref{eq:a2l}) in order to see which space-time transformations they implement. Again I calculated it obeying Leibniz and using a machine (see From SU(1,1) to Lorentz).

A replica of the Stepped Reckoner of Leibniz form 1923 (original is in the Hannover Landesbibliothek)

Here are the results of the machine work:

\begin{equation}L_1(t)=L(A_1(t))=\begin{bmatrix}
1 & 0 & 0 \\
0 & \cosh (2 t) & -\sinh (2 t) \\
0 & -\sinh (2 t) & \cosh (2 t)\end{bmatrix},\end{equation}

\begin{equation}L_2(t)=L(A_2(t))=\begin{bmatrix}
\cosh (2 t) & 0 & \sinh (2 t) \\
0 & 1 & 0 \\
\sinh (2 t) & 0 & \cosh (2 t)
\end{bmatrix},\end{equation}
\begin{equation}L_3(\phi)=L(A_3(\phi))=\begin{bmatrix}
\cos (2 \phi ) & \sin (2 \phi ) & 0 \\
-\sin (2 \phi ) & \cos (2 \phi ) & 0 \\
0 & 0 & 1 \\
\end{bmatrix},\end{equation}
The third family is a simple Euclidean rotation in the $(X,Y)$ plane. That is why I denoted the parameter with the letter $\phi.$ In order to “decode” the first two one-parameter subgroups it is convenient to introduce new variable $v$ and set $2t=\mathrm{arctanh}(v).$ The group property $L(t_1)L(t_2)=L(t_1+t_2)$ is then lost, but the matrices become evidently those of special Lorentz transformations, $L_1(v)$ transforming $Y$ and $T$, leaving $X$ unchanged, and $L_2(v)$ transforming $(X,T)$ and leaving $Y$ unchanged (though with a different sign of $v$). Taking into account the identities
\begin{eqnarray}
\cosh(\mathrm{arctanh} (v))&=&\frac{1}{\sqrt{1-v^2}},\\
\sinh(\mathrm{arctanh} (v))&=&\frac{v}{\sqrt{1-v^2}}
\end{eqnarray}
we get
\begin{equation}L_1(v)=\begin{bmatrix}
1 & 0 & 0 \\
0 & \frac{1}{\sqrt{1-v^2}} & -\frac{v}{\sqrt{1-v^2}} \\
0 & -\frac{v}{\sqrt{1-v^2}} & \frac{1}{\sqrt{1-v^2}}\end{bmatrix},\end{equation}

\begin{equation}L_2(v)=\begin{bmatrix}
\frac{1}{\sqrt{1-v^2}} & 0 & \frac{v}{\sqrt{1-v^2}} \\
0 & 1 & 0 \\
\frac{v}{\sqrt{1-v^2}} & 0 & \frac{1}{\sqrt{1-v^2}}
\end{bmatrix},\end{equation}

In the following posts we will use the relativistic Minkowski space distance on the hyperboloid for finding the distance formula on the Poincare disk.

Einstein, prędkości, styczne

[latexpage]
W Relatywistycznym składaniu prędkości wyprowadziliśmy wzór na składanie prędkości w ramach szczególnej teorii względności. Oznaczmy przez [math]\beta[/math] bezwymiarową prędkość względną [math]v/c[/math] układu odniesienia S’ względem układu odniesienia S. Niech [math]\beta'[/math] będzie prędkością S” względem S’ – przy czym S” i S’ poruszają się w tym kierunku osi [math]x[/math] względem układu S i mają tak samo ustawione osie przestrzenne y,z jak układ S. Wtedy S” porusza się względem S z prędkością [math]\beta”[/math] daną przez formułę:

[math]\beta”=\frac{\beta+\beta’}{1+\beta\beta’}[/math]

Jest to suma [math]\beta[/math] i [math]\beta’,[/math] ale `zdeformowana’ poprzez obecność mianownika. Deformacja ta jest tym większa im bliższe są [math]\beta[/math] i [math]\beta'[/math] jedynki, czyli im bliższe są prędkości światła prędkości [math]v[/math] i [math]v’.[/math] Dla małych prędkości, dla [math]\beta[/math] i [math]\beta'[/math] bliskich zera, iloczyn [math]\beta\beta'[/math] jest mały w porównaniu z jedynką, można więc go zaniedbać. Jednak dla [math]\beta,\beta'[/math] bliskich jedności mianownik jest bliski dwójki. I to powoduje deformację zwykłego dodawania w liczniku.

Narysujmy wykres funkcji [math]f_0(\beta,\beta’)=\beta+\beta'[/math] – czyli wykres zwykłego nierelatywistycznego dodawania prędkości. Wykres ten wygląda tak:

Dodawanie prędkości nierelatywistyczne
Zwykła suma

Jest to po prostu fragment płaszczyzny. Relatywistyczna formuła dodawania, w przedstawieniu graficznym ma taką postać

Relatywistyczne dodawanie prędkości
Suma zdeformowana

Widać wyraźnie deformację, widać ‘krzywiznę’. Ponieważ ‘krzywizna’ pojawi się dalej, gdy przejdziemy do ogólnej teorii względności, choć będzie w innym kontekscie, pojęciu krzywizny, jej dokładnej matematycznej definicji, warto poświęcić trochę czasu, warto weń ‘zainwestować’. Trzeba jednak zacząć od rzeczy prostszej, od stycznych.

Krzywizna krzywych płaskich.
1. Styczne

Od tego zaczniemy, bo dobrze zacząć od rzeczy prostych i potem stopniowo, przechodzić do tych bardziej złożonych. Tematowi temu poświęciłem kiedyś parę postów na moim blogu w Salon24, np. “Pędzi zawrót kolisty“. Tutaj jednak rzecz wprowadzę po kolei, w miarę systematycznie.

Krzywiznę odczuwamy intuicyjnie – znamy to z wesołego miasteczka:

Rollecoaster
Na wesołym miasteczku

Na zakrzywieniach albo nas coś wgniata, albo wręcz przeciwnie, stajemy się nieważcy. Czas więc to pojęcie sprecyzować, na razie w stosunku do krzywych płaskich.

Weźmy dla przykładu krzywą z tego obrazka:

Rollercoaster wielomianowy
Z górki na pazurki

(obrazek pożyczony z “Use Games to Motivate Your Calculus Students-Handout“)

Równanie tej krzywej ma postać:

[math]f(x)=0.5(x-5.8)(x-4)(x-0.7)(x+2.1)(x+6.19)[/math]

Jest to wielomian piątego stopnia. Krzywa ma pięć przecięć z osią x, na obrazku widać jedynie trzy z tych przecięć. Pozostałe dwa są poza polem obrazka. Pierwszą rzeczą, z którą warto się zaznajomić, to pojęcie ‘stycznej’. Zamiast tłumaczyć co to jest ‘prosta styczna do krzywej w danym punkcie’ lepiej pokazać to na obrazku. W tym celu naniosłem najpierw wykres naszej krzywej, zrobiony przy pomocy programu plotującego, na obrazek w formacie jpg – tak będzie weselej. Oczywiście musiałem w tym celu nieco przeskalować wykres (w pionie, podzieliłem krzywą przez 120), by się ta krzywa z obrazka i ta krzywa ‘zmatematyzowana’ w miarę zgodziły. Wyszło nienajgorzej.

f(x)=0.5(x-5.8)(x-4)(x-0.7)(x+2.1)(x+6.19)
Rollercoaster wielomianowy

Równanie stycznej do krzywej w punkcie a jest dane wzorem

[math]L_a(x)=f'(a)(x-a)+f(a),[/math]

gdzie [math]f'[/math] oznacza pochodną funkcji [math]f[/math] w punkcie [math]a[/math]:

[math]f ‘(a)=\lim_{h\rightarrow 0}\frac{f(a+h)-f(a)}{h}.[/math]

Narysujmy więc tę styczną w kilku różnych punktach naszej krzywej.

Krzywa f(x)=0.5(x-5.8)(x-4)(x-0.7)(x+2.1)(x+6.1) i styczne
Dziewięć stycznych

A tu narysujmy same styczne, bez rysowania krzywej:

Rodzina stycznych

Widzimy, że krzywą można rozpoznać patrząc wyłącznie na rodzinę prostych stycznych do tej krzywej.

Relatywistyczne składanie prędkości

[latexpage]
W notce Szczególna teoria względności – Cz. 1 zapisaliśmy ogólną transformację Lorentza w postaci

[math]x^\mu=\Lambda^\mu_{\mu’}x^{\mu’}.[/math]

Transformacja odwrotna zapisywana jest jako

[math]x^{\mu’}=\Lambda^{\mu’}_{\mu}x^{\mu}.[/math]

Macierz [math]\Lambda=\{\Lambda^{\mu’}_{\mu}\}[/math] winna przy tym spełniać warunek

[math]\Lambda^T\eta\Lambda=\eta[/math]

gdzie [math]\eta[/math] jest macierzą definiującą interwał czasoprzestrzenny geometrii przestrzeni Minkowskiego:

[math]\eta=\begin{pmatrix} -1&0&0&0\\0&1&0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}[/math]

W notce “Szczególne transformacje Lorentza” zajęliśmy się najprostszym ciekawym przypadkiem, gdy jeden układ odniesienia porusza się względem drugiego z prędkością v wzdłuż jednej osi – była to oś x. Wtedy

[math]x{^0}’=\gamma(x^0-\beta x)[/math]
[math]x’=\gamma (x-\beta x^0)[/math]
[math]y’=y[/math]
[math]z’=z.[/math]

gdzie

[math]\gamma=1/\sqrt{1-\beta^2},\quad \beta=v/c.[/math]

Macierz [math]\Lambda[/math] ma dla takich transformacji postać:

[math]\Lambda=\begin{pmatrix}\gamma&-\beta\gamma&0&0\\-\beta\gamma&\gamma&0&0\\0&0&1&0\\0&0&0&1\end{pmatrix}[/math]

Przyjrzyjmy się tej nietrywialnej lewej górnej klatce naszej macierzy. Dla klatki tej warunek [math]\Lambda^T\eta\Lambda=\eta[/math] daje

[math]-(\Lambda^0’_0)^2+(\Lambda^0’_1)^2=-1[/math]
[math]-(\Lambda^1’_0)^2+(\Lambda^1’_1)^2=1[/math]

W naszym przypadku [math]\Lambda^0’_0=\Lambda^1’_1=\gamma[/math], [math]\Lambda^0’_1=\Lambda^1’_0=-\beta\gamma[/math] i warunki te są automatycznie spełnione – jak łatwo się przekonać – wprost z definicji [math]\gamma[/math].

Zapiszmy nasze warunki w nieco ładniejszej dla oka postaci:

[math](\Lambda^0’_0)^2-(\Lambda^0’_1)^2=1[/math]
[math](\Lambda^1’_1)-(\Lambda^1’_0)^2=1[/math]

Przypominają one znany wzór trygonometryczny:

[math]\cos^2\alpha+\sin^2\alpha=1[/math]

tyle, że w transformacjach Lorentza mamy minus zamiast plusa. Istnieje wszak nieperiodyczna wersja funkcji trygonometrycznych, tzw. funkcje hiperboliczne.

Funkcje hiperboliczne

Zacząć tu trzeba od funkcji wykładniczej [math]e^x[/math]. Jej wykres ma dość dobrze znaną postać:

Exponential function
Funkcja wykładnicza

Przy pomocy funkcji wykładniczej tworzymy hiperboliczny odpowiednik sinusa:

Hyperbolic sinus
Sinus hiperboliczny

Definicja jest prosta:

[math]\sinh(x)=\frac{e^x-e^{-x}}{2}[/math]

Podobnie jak zwykły sinus jest to funkcja nieparzysta: [math]\sinh(-x)=-\sinh(x).[/math]

Dalej mamy cosinus hiperboliczny

[math]\cosh(x)=\frac{e^x+e^{-x}}{2}[/math]

Hyperbolic cosinus
Cosinus hiperboliczny

Ten jest funkcją parzystą: [math]\cosh(-x)=\cosh(x).[/math]

Wreszcie mamy (nieparzysty) tangens hiperboliczny:

[math]\tanh(x)=\frac{\sinh(x)}{\cosh(x)}=\frac{e^x-e^{-x}}{e^x+e^{-x}}[/math]

o wykresie

Hyperbolic tangent
Tangens hiperboliczny

Jak się łatwo przekonać wprost z definicji, dla funkcji hiperbolicznych mamy:

[math]\cosh^2\alpha-\sinh^2\alpha=1[/math]

zatem dokładnie tak jak to jest w naszej szczególnej transformacji Lorentza. Sugeruje nam ta obserwacja, że warto wprowadzić, miast wielkości [math]\beta=v/c[/math] nową wielkość [math]\alpha[/math] tak, by było:

[math]\gamma=\cosh\,\alpha[/math]

[math]\beta\gamma=\sinh\,\alpha[/math]

Wtedy [math]\beta=\frac{\beta\gamma}{\gamma}=\tanh\,\alpha[/math]. Macierz szczególnej transformacji Lorentza w dwóch wymiarach ma wtedy wyjątkowo prostą postać:

[math]\Lambda(\alpha)=\begin{pmatrix}\cosh\,\alpha&-\sinh\,\alpha\\-\sinh\,\alpha&\cosh\,\alpha\end{pmatrix}[/math]

Łatwo możemy wyrazić [math]\alpha[/math] przez [math]\beta[/math]

[math]\alpha=\mathrm{artgh}(\beta)[/math]

gdzie [math]\mathrm{artgh}[/math] jest funkcją odwrotną do tangensa hiperbolicznego, o wykresie

inverse hyperbolic tangent
Area tangens hiperboliczny

Dodawanie prędkości

Podczas gdy [math]\beta=v/c[/math] zmienia sie w zakresie [math]-1<\beta<1[/math] to [math]\alpha[/math] ma zakres [math]-\infty<\alpha<\infty[/math].

Wprowadzenie [math]\alpha[/math] miast [math]\beta[/math] ma jeszcze jedną przyjemną własność, a wiąże się ona z relatywistycznym prawem składania prędkości. Przypuśćmy, że mamy trzy układy odniesienia: S,S’,S”, przy czym S’ porusza się względem S z prędkością [math]\beta[/math] zaś S” porzusza się względem S’ z prędkością [math]\beta'[/math]. Z jaką prędkością będzie się poruszał S” względem S? Otóż, bynajmniej nie z prędkością [math]\beta+\beta'[/math].  Wymnażając macierze przekształceń Lorentza:

[math]\Lambda(\alpha)=\begin{pmatrix}\cosh(\alpha)&-\sinh(\alpha)\\-\sinh(\alpha)&\cosh(\alpha)\end{pmatrix}[/math]

[math]\Lambda(\alpha’)=\begin{pmatrix}\cosh(\alpha’)&-\sinh(\alpha’)\\-\sinh(\alpha’)&\cosh(\alpha’)\end{pmatrix}[/math]

przekonujemy się łatwo, że

[math]\Lambda(\alpha)\Lambda(\alpha’)=\Lambda(\alpha’)\Lambda(\alpha)=\Lambda(\alpha+\alpha’)[/math]

Przy składaniu prędkości dodają się więc parametry [math]\alpha[/math], zaś [math]\beta[/math] zależy od [math]\alpha[/math] w sposób nieliniowy – dla bet dodawania nie będzie! A co będzie?

Szperając w Wikipedii znaleźć możemy następującą tożsamość dla funkcji tanh:

[math]\tanh(\alpha+\alpha’)=\frac{\tanh(\alpha)+\tanh(\alpha’)}{1+\tanh(\alpha)\tanh(\alpha’)}[/math]

Podstawiając [math]\beta”=\tanh(\alpha+\alpha’),\,\beta’=\tanh(\alpha’),\,\beta=\tanh(\alpha)[/math] otrzymujemy relatyvistyczne prawo skaładania prędkości:

[math]\beta”=\frac{\beta+\beta’}{1+\beta\beta’}[/math]

lub przy pomocy prędkości, pamietająć, że [math]\beta =v/c[/math]

[math]v”=\frac{v+v’}{1+ \frac{vv’}{c^2}}[/math]

Jeśli więc np. [math]\beta=0.75c[/math], [math]\beta’=0.75c[/math] to złożenie tych dwóch prędkości nie daje bynajmniej 1.5c. Miast tego otrzymujemy

[math]\beta”=\frac{0.75+0.75}{1+(0.75)^2}=0.96c[/math]

Składając relatywistycznie prędkości mniejsze od prędkości światła nigdy prędkości światła nie przekroczymy.