hsinfu's Blog

[Summarization] Spectral Hashing

Yair Weiss, Antonio Torralba, and Robert Fergus. Spectral Hashing. Neural Information Processing Systems, 2008

這篇 paper 蠻數學的,應用到許多 Laplacian 等等。而這篇 paper 從 Semantic hashing 開始講起,Semantic hashing 是要找出一個較 compact 的 binary code 去代表原本的 feature point,而兩個 binary code 的 hamming distance 越接近的,有越像的 semantic 意涵。

我覺得這篇 paper 的一大貢獻是證明了這個 Semantic hashing 的問題是 NP-hard 的,而且提出以 spectral method (subset of thresholded eigen- vectors of the graph Laplacian) 來簡化該問題,在 efficiency 和 performance 上都比當時的 state-of-the-art 還要好上一個 large gap。

從上圖右側可以看出來 Spectral hashing 比其他的要好上取多,而從左側可以看出 Spectral hashing 可以相容於其他方法,並進一步與之結合,達到更高的準確率。