Search on the blog

2017年2月25日土曜日

SRM 539 Div2 500 Over9000Rocks

問題概要
n個の箱がある。この中からいくつかの箱を選んで石を入れたい。
ただしそれぞれの箱には入れる石の下限と上限が決められており、その箱を選んだ場合は[下限, 上限]の個数の石を入れないといけない。
  • X > 9000
  • いくつかの箱を選んで石をいれたときに、入れた石の合計個数がXになる
という条件を満たすようなXの個数を求めよ。

ただし、入力値は以下の条件を満たす。
1 <= n <= 15
1 <= 下限値 <= 1,000,000
対応する下限値 <= 上限値 <= 1,000,000

解き方
まず選ぶ箱の集合を全列挙する。
箱の集合が決まれば、選んだ集合にいれることのできる石の合計値の下限、上限が求まる。あとは、この下限から上限までの範囲の値が選べるということを記憶するためのデータ構造があればよい。

div2 500で遅延セグ木書かせるのか。もっと楽な方法があるはず。と思って、そういば「いもす法」ってやつがあるのを思い出して書いてみた。

コード
「いもす法」便利。
上位陣の人は+/-されるところの点をmapで管理して書いていた。
自分のはint16_tでメモリ制限ぎりぎりセーフ解。

int16_t imos[15000010];

class Over9000Rocks {
  public:
  int countPossibilities(vector<int> lb, vector<int> ub) {
    memset(imos, 0, sizeof(imos));

    int n = lb.size();
    REP (mask, 1<<n) {
      if (!mask) continue;
      int l = 0;
      int r = 0;
      REP (i, n) {
        if (mask & 1 << i) {
          l += lb[i];
          r += ub[i];
        }
      }
      imos[l]++;
      imos[r+1]--;
    }

    int ret = 0;
    int cur = 0;
    FOR (i, 1, 15000010) {
      cur += imos[i];
      if (cur > 0 && i > 9000)
        ++ret;
    }
    
    return ret;
  }
};

2017年2月21日火曜日

EMアルゴリズムの分かりやすい資料

 EMアルゴリズムの分かりやすい資料を見つけた。半年くらい前に混合ガウス分布を例にした資料をもとに勉強してだいたい理解したつもりでいたが、いまいちしっくりきていない部分があったのでもう一度別の資料で勉強しなおした。

What is the expectation maximization algorithm?

これを読むと以下のことが理解できる。EMアルゴリズムの復習をしたいときは読み直すとよい。
  • やりたいことのイメージ
    • コイントスを用いたシンプルな例
  • Eステップ、Mステップの名前の由来
    • Eステップでは、潜在変数の確率分布を求める。実際には分布そのものではなく、十分な情報をもつ統計量の期待値を求める。
    • Mステップでは、対数尤度を最大化するようにモデルを再構築する。
  • EMアルゴリズムの応用例
    • バイオインフォマティクス領域でよく使われるらしい
    • DNAシーケンスのクラスタリング(多次元正規分布)
  • よくあるEMアルゴリズム更新のイメージ図の理解(*注)
    • Eステップで出した凹関数が求めたい真の関数の下限になっているのは何故か?
    • Eステップで出した凹関数と真の関数が接するのは何故か?
    • EMアルゴリズムでなぜ局所解に到達するのか?
注) 数学的に厳密な説明は載ってないが、イメージ的に分かる。

関数の括弧の中のセミコロン

 関数の定義で f(x; θ) のような表記があった。

xとθの関数なので f(x, θ) でいいのではと思ったが、セミコロンで区切られている。
セミコロンで区切ると、セミコロンの前は変数、セミコロンの後はパラメータという意味らしい。

f(x; θ)はパラメータθによって特徴付けられる、xを変数として受け取る関数fみたいなイメージ。
θは変数ではなく、fを定義するときに決定する固定値というふうに考える。

2017年2月16日木曜日

データ圧縮してscpする

 4.5GBあるファイルをscpで転送していて中々終わらずイライラしていたら、

「Dash! C Capital!」

という声が隣から聞こえた。
最初は何のことか分からなかったが、「-Cをつけるとデータ圧縮とscp同時にしてくれて速くなるよ。」ということだった。

$ scp -C source user@server:/path/to/backup

scpが遅い場合は、-Cをつける。今日もまた一つ新しい学びがあった。