본문 바로가기
Physics/통계역학

[통계역학] 1.4 정준 앙상블 Canonical Ensemble

by 피그티 2020. 8. 4.

지난 페이지까지 macrostate (N,V,E) 가 주어진 시스템의 열역학적 값들을 microstate 개수 Ω 로부터 구할 수 있다는 것과 microcanonical ensemble(소정준 앙상블)을 통해 Ω 를 고전적 한계에서 유추할 수 있었다. 그러나 현실적으로 우리가 관심있는 시스템은 거의 대부분 주변과 상호작용을 하기 때문에, energy E 를 일정하게 유지하기 힘들다. 따라서 E 를 일정하게 유지하는 대신, temperature T 를 일정하게 유지하여 이론을 전개할 수 있는데, 이러한 경우를 canonical ensemble(정준 앙상블)이라고 한다. 이번 페이지에서는 canonical ensemble에 대하여 살펴본다.


#Canonical Ensemble

시스템이 열역학 과정에서 temperature를 유지하기 위해서는 시스템이 아주 큰 capacitor를 가진 물질로 둘러쌓여, 시스템의 에너지 변화가 둘러싸고 있는 temperature에 거의 영향을 주지 못하는 환경으로 만들 수 있다. canonical ensemble에서 energy의 값은 고정되어 있지 않기 때문에, 이론이 허용하는 모든 값을 가질 수 있다. 문제는 측정이 이루어지는 시간 동안, 특정한 energy값 Es 를 가질 확률이 어느 정도 되는가 이다.


먼저 ensemble에 이 시스템의 복사본 N 개가 있다고 하자. 또한, 시스템 복사본들의 에너지를 합한 총 에너지를 E 라고 하자. 만약 시스템에 허용되는 energy level들을 Es , s=0,1,2, 이라고 하고, energy level Es 에 해당하는 복사본의 개수를 ns 라고 하면, ensemble에서 energy값이 Es 인 시스템의 비율은 nsN 이 된다. 이러한 상황은 Es 라는 방에 N 개의 복사본을 ns 씩 배치하는 상황이다.


이 때, 이렇게 배치하는 경우의 수는

W{ns}=N!n0!n1!n2!

가 있다. Equal a priori probabilities[각주:1]로부터 각각 경우의 수는 동등한 확률을 가진다고 한다면, 결국 W{ns} 에 비례하는 시간동안 {ns} 상태에 시스템이 머무를 것이다.


#Finding Probabilities Maximizing Multiplicity

만약 특정한 {ns} 세트가 다른 {ns} 세트들에 비하여 압도적으로 높은 W 값을 가진다면, equal a prior probabilities에 의해 대부분의 시간 동안 {ns} 의 분배 상태로 있을 것이다. 따라서 W 값을 최대로 하는 {nr} 세트로 ensemble이 구성된다고 할 수 있다. 따라서 Ps 을 구하는 문제는 constraint

sns=NsnsEs=E

에서

lnW=lnN!slnns!NlnNsnrlnnr

를 최대화시키는 {nr} 세트를 구하는 것이다.[각주:2] 이 문제는 수학적으로 Lagrange multiplier 문제이다.[각주:3] 미정계수 αβ 를 도입하면

lnWα (snsN)β (snsEsE)=0

를 만족하는 {ns} 세트에서 최대값이 된다. 즉, 모든 s 값에 대하여,

nslnW|nsαns(snsN)|nsβns(snsEsE)|ns=0

을 만족해야 한다. 위 식을 풀면, (lnns+1)αβEs=0 이므로

ns=e(1+α)βEs=AeβEs

따라서,

Ps=nsN=nssns=eβEsseβEs

임을 알 수 있다.


#Partition Function

Lagrange multiplier β 값은

EN=sEsnssns=sEseβEsseβEs=βln(seβEs)

이고 EN 은 ensemble의 평균 energy이므로, Helmholtz free energy A 에 대하여,

U=A+TS=AT(AT)N,V=[(A/T)(1/T)]N,V

이므로 위 식과 비교해 보면[각주:4],

β=1kT,ln(seβEs)=AkT

임을 알 수 있다.[각주:5] 이를 정리하면 다음과 같다.


THEOREM            Canonical Ensemble


주어진 macrostate (N,V,T) 에 대하여, 시스템이 허용된 energy값 Es 를 가질 확률은

Ps=eβEsseβEs      where β=1kT

이고, 이 때, (평균) Helmholtz free energy는

A(N,V,T)=1βln(seβEs)

가 된다.


따라서 이 시스템의 thermodynamic quantity는 Helmholtz free energy로부터 구할 수 있다. 이 때, Helmholtz free energy를 구하는데 핵심이 되는 값 ln(seβEs)partition function(분배 함수)이라고 하고 ZN(V,T) 로 표시한다.


DEFINITION            Partition Function

ZN(V,T)=seβEs


#Shannon Entropy

이 확률 분포에서 lnPs 의 expected value를 구해보자. 먼저

lnPs=lneβEsZN(V,T)=βEslnZN(V,T)=βEs+βA

따라서 expected value는

lnPs=βs(PsEs)+βA

sum 값은 (평균) 에너지이므로

lnPs=β(UA)=Sk

따라서

S=ksPslnPs

를 얻는다. 즉 entropy는 확률 분포 Ps 에 의해서만 결정된다는 결론을 얻는다. 이 entropy 식은 물리적인 시스템이 아니더라도 확률 분포를 가지는 모든 문제에 대하여 entropy를 정의할 수 있는 식이 된다. 이러한 개념은 특히 정보의 압축에서 핵심적인 개념으로 등장했다. 이러한 entropy 개념을 Shannon entropy라고 한다.


#Method of Steepest Descent

위에서 canonical ensemble의 확률 분포를 구하기 위하여, 특정한 {ns} 세트가 다른 세트들에 비하여 압도적으로 높은 W 값을 가진다고 하였다. 이것이 사실이라면, 압도적인 시간동안 nsns 상태에 있으므로, ns 의 시간에 대한 평균값(즉, 따ensemble의 expected value)는 ns 와 거의 동일해야 한다. 실제로 그러한 결과가 나오는지 살펴보자.


먼저 W 대신 다음과 같이 W 를 정의하자.[각주:6]

W{ns}=Nω0n0n0!ω1n1n1!ω2n2n2!

또한 constraint sns=N , snsEs=E=NU 를 만족하는 세트들의 합을 다음과 같이 정의하자

Γ={ns} in constraintsW{ns}

그러면 ns 의 expected value는

ns={ns} in constraintsnsW{ns}{ns} in constraintsW{ns}=ωsωslnΓ |ω0,ω1,=1

그러나 Γ 의 sum이 constraint를 만족하는 세트들에 대한 합이기 때문에 이를 정리하는 것은 거의 불가능하다. 따라서 다음과 같은 보조 함수를 정의한다.

G(N,z)=U=0ΓzNU

GΓ 를 대입하면,

G(N,z)=U=0{ns} in constraintsNn0!n1!n2!(ω0zE0)n0(ω1zE1)n1(ω2zE2)n2

이 되는데, 첫번째 sum과 두번째 sum이 결합하여 결국은 constraint가 sns=N 하나만 남는다. 따라서 multinomial theorem에 의해

G(N,z)=(ω0zE0+ω1zE1+ω2zE2+)E=[f(z)]N

이 된다. 만약 허용된 energy값 Es 들이 정수값이 된다면, f(z) 는 holomorphic function이 될 것이다. 따라서, energy의 단위를 Es 값들을 정수가 되도록 적당히 조정한다면, G(N,z) 는 holomorphic이 된다. Residue integral을 이용해, z=0 의 neighborhood에서, z=0 을 포함하는 contour에 대하여

Γ=12πi[f(z)]NzNU+1 dz

로 구할 수 있다.


이 적분은 method of steepest descent라는 방법을 사용하여 계산할 수 있다. method of steepest descent는 매우 큰 λ , contour C 에 대하여,

Ch(z)eλg(z) dz

는 다음을 만족하는 새로운 contour C 으로 계산할 수 있다는 것이다.


   1. Cg(z) 가 0인 점들을 지난다.


   2. C 위에서 g(z) 의 imaginary part는 상수이다.


따라서

[f(z)]NzNU+1=eNg(z)

로 정의하면,

g(z)=lnf(z)(U+1N)lnz

위의 조건을 만족하는 contour C 에서

g(z0)=f(z0)f(z0)NU+1Nz0=0

이므로 N 인 경우

Uz0f(z0)f(z0)=sωsEsx0Essωsx0Es

그리고

g(z0)=f(z0)f(z0)[f(z0)]2[f(z0)]2+NU+1Nz02f(z0)f(z0)U2Uz02

이 된다. 따라서 z=z0 의 neighborhood에서 z=z0+iyg(z) 값은

g(z)=g(z0)12g(z0)y2+

이므로 integrand는

[f(z)]NzNU+1=eNg(z)=[f(z0)]Nz0NU+1exp(N2g(z0)y2)

이므로

Γ12πi[f(z0)]Nz0NU+1exp(N2g(z0)y2) idy= 12πi[f(z0)]Nz0NU+11[2πNg(z0)]12

따라서

1NlnΓ=lnf(z0)Ulnz01Nlnz012Nln(2πNg(z0)

N 에서 위 식은 1NlnΓ=lnf(z0)Ulnz0 이 된다. 이제, z0=eβ 로 정의하면,

1NlnΓ=ln(sωseβEs)+βU

따라서 이 식을 ωs 에 대해서 편미분하고 모든 ωi 에 1을 대입하면 nsN 을 얻을 수 있다.

nsN=ωseβEssωseβEs|ω0,ω1,=1+[sωsEseβEssωseβEs+U]ωsβωs|ω0,ω1,=1

이 때, 가운데 괄호 안의 값은 U 의 정의[각주:7]상 0이므로

nsN=eβEsseβEs

결국 W 를 최대화하는 {ns} 세트의 결론과 expected value의 결론이 같음을 알 수 있다. 이 방법의 강점은 ns 의 분산을 구할 수 있다는 것이다.

ns2=ns2W{nr}W{nr}=1Γ(ωsωs)(ωsωs)Γ |ω0,ω1,=1

로부터

Var(ns)=ns2ns2=(ωsωs)(ωsωs)lnΓ |ω0,ω1,=1

를 이용해 구할 수 있다.


#Partition Function of Continuous Energy Spectrum System

만약 energy level Es 가 degenerate되어 있는 경우, degeneracy를 gs 라고 하자. Degeneracy를 이용하여 partition function을 다음과 같이 쓸 수 있다.

ZN(V,T)=sgseβEs

또한 허용되는 energy level이 연속적인 경우에는 summation 대신 integral을 사용하고, degeneracy 대신 density of state g(E) 를 이용하여

ZN(V,T)=g(E)eβE dE

가 된다. 따라서 허용되는 energy level이 연속적인 경우에는 partition function이 density of state의 Laplace transform인 것을 알 수 있다. 반대로 density of state의 inverse Laplace transform이 partition function이 된다.

g(E)=12πilimTβiTβ+iTZN(V,T)eβE dβ



  1. 1.1 거시상태, 미시상태, 볼츠만 상수 Macrostate, Microstate, Boltzmann Constant 참고. [본문으로]
  2. \(W\) 최대화시키는 것은 \(\ln{W}\) 를 최대화시키는 것과 같다. 마지막 등호는 Stirling formula \(\ln{x!}=x\ln{x} - x\). [본문으로]
  3. 자세한 내용은 --lagrangemultiplier-- 참고. [본문으로]
  4. 위 식도 \(N\) 과 \(V\) 가 고정된 상태의 편미분이다. [본문으로]
  5. 다만, 아직은 \(k\) 가 1.1 거시상태, 미시상태, 볼츠만 상수 Macrostate, Microstate, Boltzmann Constant에서 정의한 Boltzmann constant인지 알 수는 없다. 이 값이 Boltzmann constant인 것은 1.4-(2) Example: 이상기체 Ideal Gas에서 확인할 수 있다. [본문으로]
  6. 원래의 \(W\) 가 되기위해서는 모든 \(\omega_s\) 값이 1이면 된다. [본문으로]
  7. 확률 분포에서 평균에너지. [본문으로]