7.4 Задачи о рюкзаке¶

Термин «задачи о рюкзаке» объединяет задачи, в которых дан набор объектов, и нужно выбрать некоторое подмножество, удовлетворяющее нужным условиям. Очень часто такие задачи удобно решать с помощью динамического программирования.

В этом разделе рассмотрим такую постановку:

Дан набор весов (w_1, w_2, \dots, w_n). Нужно определить все суммы, которые можно получить, выбирая некоторые из этих весов.

Пример¶

Пусть веса равны:

[ [2,4,4,7] ]

Тогда можно получить такие суммы:

Сумма	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17
Возможна?	✓		✓		✓		✓	✓	✓	✓	✓		✓	✓	✓	✓		✓

То есть достижимы суммы:

[ 0,2,4,6,7,8,9,10,12,13,14,15,17. ]

Например, сумма (13) получается как (2+4+7), а сумма (15) — как (4+4+7).

Идея динамики¶

Будем рассматривать подзадачи, в которых разрешено использовать только первые (k) весов.

Обозначим:

\[ possible(x,k)=\text{true}, \]

если сумму (x) можно набрать с помощью первых (k) весов, и

\[ possible(x,k)=\text{false}, \]

если это невозможно.

Тогда возникает естественный переход:

\[ possible(x,k)=possible(x-w_k, k-1) \lor possible(x, k-1). \]

Почему формула верна¶

Для веса (w_k) есть ровно два варианта:

Мы берём этот вес. Тогда осталось проверить, можно ли набрать сумму (x-w_k) первыми (k-1) весами.
Мы не берём этот вес. Тогда нужно проверить, достижима ли сумма (x) без него, то есть первыми (k-1) весами.

Если хотя бы один из этих двух вариантов возможен, то сумма (x) достижима.

Базовые случаи¶

Если мы не используем ни одного веса, то можно получить только сумму 0:

\[ possible(x,0)= \begin{cases} \text{true}, & \text{если } x=0, \\ \text{false}, & \text{если } x\ne 0. \end{cases} \]

Это важная отправная точка для всей динамики.

Таблица состояний¶

Для весов ([2,4,4,7]) таблица истинности будет такой:

(k \ x)	0	2	4	6	7	8	9	10	12	13	14	15	17
0	✓
1	✓	✓
2	✓	✓	✓	✓
3	✓	✓	✓	✓		✓		✓
4	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓

После вычисления этой таблицы значение (possible(x,n)) сразу отвечает на вопрос, достижима ли сумма (x) с использованием всех весов.

Решение с двумерной динамикой¶

Пусть (W) — сумма всех весов. Тогда можно построить таблицу DP размера (O(nW)).

possible[0][0] = true;

for (int k = 1; k <= n; k++) {
    for (int x = 0; x <= W; x++) {
        if (x - w[k] >= 0)
            possible[x][k] |= possible[x - w[k]][k - 1];
        possible[x][k] |= possible[x][k - 1];
    }
}

Что здесь происходит¶

possible[x][k] хранит, можно ли набрать сумму x, используя первые k весов;
переход «взять текущий вес» реализован строкой possible[x][k] |= possible[x - w[k]][k - 1];
переход «не брать текущий вес» реализован строкой possible[x][k] |= possible[x][k - 1];

Такое решение наглядное, но использует довольно много памяти.

Оптимизация памяти¶

Можно заметить, что для вычисления очередного слоя по (k) нам нужен только предыдущий слой. Поэтому вместо двумерной таблицы удобно хранить одномерный массив:

[ possible[x] = \text{можно ли набрать сумму } x. ]

Тогда получаем более компактное решение:

possible[0] = true;

for (int k = 1; k <= n; k++) {
    for (int x = W; x >= 0; x--) {
        if (possible[x]) possible[x + w[k]] = true;
    }
}

Почему проход справа налево обязателен¶

Это ключевой момент.

Если бы мы шли по x слева направо, то один и тот же вес можно было бы использовать несколько раз в рамках одной итерации. А нам нужно, чтобы каждый вес использовался не более одного раза.

Именно поэтому массив обновляется справа налево: так новые значения не успевают повлиять на ещё не обработанные состояния текущего шага.

Небольшая иллюстрация¶

Для весов ([2,4,4,7]) одномерная динамика обновляется так:

flowchart TD
    A[Старт: достижима только сумма 0] --> B[Добавляем вес 2]
    B --> C[Появляется сумма 2]
    C --> D[Добавляем вес 4]
    D --> E[Появляются суммы 4 и 6]
    E --> F[Добавляем ещё один вес 4]
    F --> G[Появляются суммы 8 и 10]
    G --> H[Добавляем вес 7]
    H --> I[Получаем новые суммы 7, 9, 13, 15, 17 и другие]

Hold "Ctrl" to enable pan & zoom

Сложность¶

Двумерная версия¶

Время: (O(nW))
Память: (O(nW))

Одномерная версия¶

Время: (O(nW))
Память: (O(W))

Здесь (W) — сумма всех весов.

Главное, что стоит запомнить¶

Во многих задачах о рюкзаке удобно думать так: что можно получить после обработки первых (k) предметов.
Для каждого предмета обычно есть два варианта: взять или не взять.
Часто двумерную динамику можно сжать до одномерной.
В задаче о достижимых суммах при сжатии памяти нужно обновлять массив справа налево.

Такой подход — одна из базовых моделей динамического программирования и встречается во множестве задач: от проверки достижимости суммы до максимизации ценности при ограничении на вес.

(k \ x)	0	2	4	6	7	8	9	10	12	13	14	15	17
0	✓
1	✓	✓
2	✓	✓	✓	✓
3	✓	✓	✓	✓		✓		✓
4	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓

(k \ x)	0	2	4	6	7	8	9	10	12	13	14	15	17
0	✓
1	✓	✓
2	✓	✓	✓	✓
3	✓	✓	✓	✓		✓		✓
4	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓

(k \ x)	0	2	4	6	7	8	9	10	12	13	14	15	17
0	✓
1	✓	✓
2	✓	✓	✓	✓
3	✓	✓	✓	✓		✓		✓
4	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓	✓