|
Top > エントロピー シャノンの情報量:エントロピーシャノンは情報理論の測定単位としてビットを考えた。 ある事象が起こる確率をpとするとき,それが起こったという情報が持つ情報量Sは, S=-logp [ビット] である。
符号化に関するシャノンの補助定理
文字をビット列に置き換えること。`a'という文字を`00'、`b'という文字を`01'と置き換える。 置き換えられたビット列を符号語という。元に戻すのは復号化。 瞬時復号可能な符号化Kがあったとして,それぞれの符号語の出現確率をp1,p2,p3,・・・とすると、符号語が出現するという事象の持つ情報量Ikはlog2(pk)であり、 平均情報量であるところのエントロピーEは、 E=-Σpilogpi とあらわせる このとき、平均符号長LとエントロピーEの間には、 E<または=L という関係が成立する。これがシャノンの補助定理。 一意に復号可能な符号化はその平均符号語長をエントロピーより小さくできない。 エントロピーある事象Aが起こる確率をpとすれば,起こらない確率はq=1-pです。このとき,Aが起こったとすれば,その情報量は-logp,起こらなかったとすれば,その情報量は-logqです。それで,全体の情報量の期待値は, H=-plogp-qlogq となります。このようなHのことをエントロピーといいます。
Claude Shannon in 1948In information theory, entropy is the measure of the amount of information that is missing before reception and is sometimes referred to as Shannon entropy. Shannon entropy is a broad and general concept which finds applications in information theory as well as thermodynamics. It was originally devised by Claude Shannon in 1948 to study the amount of information in a transmitted message. The definition of the information entropy is, however, quite general, and is expressed in terms of a discrete set of probabilities H(x)=-p1logp1-p2logp2・・・-pnlogpn, The entropy, H, of a discrete random variable X is a measure of the amount of uncertainty associated with the value of X. In the case of transmitted messages, these probabilities were the probabilities that a particular message was actually transmitted, and the entropy of the message system was a measure of how much information was in the message. For the case of equal probabilities (i.e. each message is equally probable), the Shannon entropy (in bits) is just the number of yes/no questions needed to determine the content of the message. エントロピー最大とは例題を考えます。消費者が、AとBの商品を、何の情報もなく選択する確率は、半々でしょう。 2個から1個を選ぶ確率分布のエントロピーは, H=-plogp-(1-p)log(1-p) となりますが,p=0.5(q=0.5)のときに最大になります。
このように、エントロピー最大となる確率は、情報量によって異なりますが、自然の状態はエントロピー最大の分布が現れると考えます。 1因子情報路による選択の問題''制約条件下でエントロピーを最大化する問題をエントロピー・モデルとよぶ。 特に価格などひとつの因子を与えて構成比を求める場合は、⼀因⼦情報路モデル呼ぶ。'' 問題です。 消費者が全然知識のない商品AとBがあり,Aの価格は200円,Bの価格は100円とします。 商品AとBの販売比率p,q(=1-p)を求めなさい。 この場合、 消費者は消費金額をできるだけ少なくし、エントロピーが最大になるような、購入分布になる と考えるのが、自然でしょう。何せ、自然な状態は、エントロピー最大ですから・・・。 そこで エントロピー/費用=L=H/C --->最大化 H=-Plogp + (1-p)log(1-p) 費用の期待値:C=200p+100(1-p) を行いましょう。 この問題は L=(plogp+qlogq)/(2p+q)--->MAX subject to p+q=1 ラグランジェの未定定数法で、未定乗数をλとして ∂ {H/c+λ(p+q-1)} / ∂p=0,
∂ {H/C+λ(p+q-1)} / ∂q=0,
を解けばよい。 (∂H/ ∂p・c- ∂ c/∂p ・H)/c^2+λ ={-(log p+loge)l-2H}/C^2+λ=0,
となり、これを解いて、 log p=-log e-2H/c+λc, log q=-log e-H/c+λc となるので、 p log p+q log q=-log e-H+λc。 これより、λ=loge/lとなり、これを代入すると、 p=2^(-2H/c), q=2^(-H/c) となる。ここで、2^(-H/c)=Xとおけば、 p=x^2, q=x^1 となる。 いま、p+q=1であるから、 x^2 +x^1=1 となる。 X^2 +X=1 を解いてxを求め、p=x^2, q=x^1 を求められる。
1因子情報路での多数選択の手順n個の銘柄があり,その特性(価格)がc1,c2,・・・,cnであるとき, X^c1+X^c2+・・・+X^cn=1 の根をX(0<X<1)とすれば, n個の銘柄の分散確率(販売比率),p1,p2,・・・,pnは, p1=X^c1, p2=X^c2, ・・・, pn=X^cn で求められる。 逆一因子情報路の問題これは、確率を与えて、因子の値をどうすればよいかを求める問題である。
天秤問題:情報量の問題
|