Перейти к содержанию

SSIM

Эта статья находится на начальном уровне проработки, в одной из её версий выборочно используется текст из источника, распространяемого под свободной лицензией
Материал из энциклопедии Руниверсалис

Индекс структурного сходства (SSIM от англ. structure similarity) является одним из методов измерения схожести между двумя изображениями. SSIM-индекс это метод полного сопоставления, другими словами, он проводит измерение качества на основе исходного изображения (не сжатого или без искажений). SSIM-индекс является развитием традиционных методов, таких как PSNR (peak signal-to-noise ratio) и метод среднеквадратичной ошибки MSE, которые оказались несовместимы с физиологией человеческого восприятия.

Отличительной особенностью метода, помимо упомянутых ранее (MSE и PSNR), является то, что метод учитывает «восприятие ошибки» благодаря учёту структурного изменения информации. Идея заключается в том, что пиксели имеют сильную взаимосвязь, особенно когда они близки пространственно. Данные зависимости несут важную информацию о структуре объектов и о сцене в целом.

SSIM метрика рассчитана на различные размеры окна. Разница между двумя окнами [math]\displaystyle{ x }[/math] и [math]\displaystyle{ y }[/math] имеющими одинаковый размер N×N:

[math]\displaystyle{ \text{SSIM}(x,y) = \frac{(2\mu_x\mu_y + c_1)(2\sigma_{xy} + c_2)}{(\mu_x^2 + \mu_y^2 + c_1)(\sigma_x^2 + \sigma_y^2 + c_2)}, }[/math]

где

  • [math]\displaystyle{ \mu_x }[/math]среднее [math]\displaystyle{ x }[/math],
  • [math]\displaystyle{ \mu_y }[/math] — среднее [math]\displaystyle{ y }[/math],
  • [math]\displaystyle{ \sigma_x^2 }[/math]дисперсия [math]\displaystyle{ x }[/math],
  • [math]\displaystyle{ \sigma_y^2 }[/math] — дисперсия [math]\displaystyle{ y }[/math],
  • [math]\displaystyle{ \sigma_{xy} }[/math]ковариация [math]\displaystyle{ x }[/math] и [math]\displaystyle{ y }[/math],
  • [math]\displaystyle{ c_1 = (k_1L)^2 }[/math], [math]\displaystyle{ c_2 = (k_2L)^2 }[/math] — две переменных:
    • [math]\displaystyle{ L }[/math]динамический диапазон пикселей (обычно [math]\displaystyle{ 2^\text{(bits per pixel)} - 1 }[/math]),
    • [math]\displaystyle{ k_1 = 0{,}01 }[/math] и [math]\displaystyle{ k_2 = 0{,}03 }[/math] — константы.

Приведённая формула применима только для яркости изображения, по которой и происходит оценка качества. Полученный SSIM-индекс лежит в пределах от −1 до +1. Значение +1 достигается только при полной аутентичности образцов. Как правило, метрика рассчитана на окно размером 8×8 пикселей. Окно может смещаться через пиксель, но специалисты рекомендуют использовать группы окон для уменьшения сложности вычислений.

Структурные отличия (DSSIM от англ. Structural dissimilarity) можно выразить через SSIM-метрику:

[math]\displaystyle{ \text{DSSIM}(x,y) = \frac{1 - \text{SSIM}(x, y)}{2}. }[/math]

См. также

Ссылки

Внешние источники