Как вернуть страницу результатов из SQL?
Многие приложения имеют сетки, которые отображают данные из таблицы базы данных по одной странице за раз. Многие из них также позволяют пользователю выбирать количество записей на странице, сортировать по любому столбцу и перемещаться вперед и назад по результатам.
Какой хороший алгоритм для реализации этого шаблона без передачи всей таблицы клиенту с последующей фильтрацией данных на клиенте? Как вы предоставляете пользователю только те записи, которые хотите показать?
Упрощает ли LINQ решение?
Ответов (8)8
В MS SQL Server 2005 и выше ROW_NUMBER (), похоже, работает:
T-SQL: пейджинг с помощью ROW_NUMBER ()
DECLARE @PageNum AS INT;
DECLARE @PageSize AS INT;
SET @PageNum = 2;
SET @PageSize = 10;
WITH OrdersRN AS
(
SELECT ROW_NUMBER() OVER(ORDER BY OrderDate, OrderID) AS RowNum
,OrderID
,OrderDate
,CustomerID
,EmployeeID
FROM dbo.Orders
)
SELECT *
FROM OrdersRN
WHERE RowNum BETWEEN (@PageNum - 1) * @PageSize + 1
AND @PageNum * @PageSize
ORDER BY OrderDate
,OrderID;
Я бы рекомендовал либо использовать LINQ, либо попытаться скопировать то, что он делает. У меня есть приложение, в котором я использую методы Take и Skip LINQ для извлечения выгружаемых данных. Код выглядит примерно так:
MyDataContext db = new MyDataContext();
var results = db.Products
.Skip((pageNumber - 1) * pageSize)
.Take(pageSize);
Запуск SQL Server Profiler показывает, что LINQ преобразует этот запрос в SQL аналогично:
SELECT [ProductId], [Name], [Cost], and so on...
FROM (
SELECT [ProductId], [Name], [Cost], [ROW_NUMBER]
FROM (
SELECT ROW_NUMBER() OVER (ORDER BY [Name]) AS [ROW_NUMBER],
[ProductId], [Name], [Cost]
FROM [Products]
)
WHERE [ROW_NUMBER] BETWEEN 10 AND 20
)
ORDER BY [ROW_NUMBER]
Говоря простым языком: 1. Отфильтруйте свои строки и используйте функцию ROW_NUMBER для добавления номеров строк в нужном вам порядке.
2. Фильтр (1) возвращает только те номера строк, которые вам нужны на странице.
3. Отсортируйте (2) по номеру строки, который соответствует желаемому порядку (в данном случае по имени).
Есть несколько решений, которые я использую с MS SQL 2005.
Один из них - ROW_NUMBER (). Но лично мне не нравится ROW_NUMBER (), потому что он не работает для больших результатов (БД, над которой я работаю, действительно большая - более 1 ТБ данных, выполняющих тысячи запросов в секунду - ну, вы знаете - большие социальные сети сайт).
Вот мое любимое решение.
Я буду использовать своего рода псевдокод T-SQL.
Найдем 2-ю страницу пользователей, отсортированных по имени, фамилии, где на каждой странице по 10 записей.
@page = 2 -- input parameter
@size = 10 -- can be optional input parameter
if @page < 1 then begin
@page = 1 -- check page number
end
@start = (@page-1) * @size + 1 -- @page starts at record no @start
-- find the beginning of page @page
SELECT TOP (@start)
@forename = forename,
@surname = surname
@id = id
FROM
users
ORDER BY
forename,
surname,
id -- to keep correct order in case of have two John Smith.
-- select @size records starting from @start
SELECT TOP (@size)
id,
forename,
surname
FROM
users
WHERE
(forename = @forename and surname = @surname and id >= @id) -- the same name and surname, but bigger id
OR (forename = @forename and surname > @surname) -- the same name, but bigger surname, id doesn't matter
OR (forename > @forename) -- bigger forename, the rest doesn't matter
ORDER BY
forename,
surname,
id
LINQ в сочетании с лямбда-выражениями и анонимными классами в .Net 3.5 значительно упрощает подобные вещи.
Запрос базы данных:
var customers = from c in db.customers
join p in db.purchases on c.CustomerID equals p.CustomerID
where p.purchases > 5
select c;
Количество записей на странице:
customers = customers.Skip(pageNum * pageSize).Take(pageSize);
Сортировка по любому столбцу:
customers = customers.OrderBy(c => c.LastName);
Получение с сервера только выбранных полей:
var customers = from c in db.customers
join p in db.purchases on c.CustomerID equals p.CustomerID
where p.purchases > 5
select new
{
CustomerID = c.CustomerID,
FirstName = c.FirstName,
LastName = c.LastName
};
Это создает статически типизированный анонимный класс, в котором вы можете получить доступ к его свойствам:
var firstCustomer = customer.First();
int id = firstCustomer.CustomerID;
По умолчанию результаты запросов загружаются лениво, поэтому вы не разговариваете с базой данных до тех пор, пока вам действительно не понадобятся данные. LINQ в .Net также значительно упрощает обновления, сохраняя контекст данных любых внесенных вами изменений и обновляя только те поля, которые вы изменяете.
Об этом идет обсуждение Здесь
Метод получает номер страницы 100 000 из базы данных 150 000 строк за 78 мс.
Используя знания оптимизатора и SET ROWCOUNT, первый EmployeeID на запрошенной странице сохраняется в локальной переменной для начальной точки. Затем установите ROWCOUNT на максимальное количество записей, запрошенных в @maximumRows. Это позволяет гораздо более эффективно пролистывать результирующий набор. При использовании этого метода также используются преимущества ранее существовавших индексов в таблице, поскольку он идет непосредственно в базовую таблицу, а не в локально созданную таблицу.
Боюсь, я не могу судить, лучше ли он, чем принятый в настоящее время ответ.
По сути, есть два способа разбивки на страницы в базе данных (я предполагаю, что вы используете SQL Server):
Использование смещения
Другие объяснили, как ROW_NUMBER() OVER()
функцию ранжирования можно использовать для отображения страниц. Стоит отметить, что SQL Server 2012 наконец-то включил поддержку стандартного OFFSET .. FETCH
предложения SQL :
SELECT first_name, last_name, score
FROM players
ORDER BY score DESC
OFFSET 40 ROWS FETCH NEXT 10 ROWS ONLY
Если вы используете SQL Server 2012 и обратная совместимость не является проблемой, вам, вероятно, следует предпочесть это предложение, поскольку оно будет выполняться SQL Server более оптимально в крайних случаях.
Использование метода SEEK
Существует совершенно другой, гораздо более быстрый, но менее известный способ выполнения подкачки в SQL. Это часто называют «методом поиска», как описано в этом сообщении в блоге здесь .
SELECT TOP 10 first_name, last_name, score
FROM players
WHERE (score < @previousScore)
OR (score = @previousScore AND player_id < @previousPlayerId)
ORDER BY score DESC, player_id DESC
Значения @previousScore
и @previousPlayerId
являются соответствующими значениями последней записи с предыдущей страницы. Это позволяет вам перейти на «следующую» страницу. Если ORDER BY
направление есть ASC
, просто используйте >
вместо него.
С помощью описанного выше метода вы не можете сразу перейти на страницу 4, не загрузив сначала предыдущие 40 записей. Но часто вы все равно не хотите прыгать так далеко. Вместо этого вы получаете гораздо более быстрый запрос, который может получать данные за постоянное время, в зависимости от вашей индексации. Кроме того, ваши страницы остаются «стабильными» независимо от того, изменяются ли базовые данные (например, на странице 1, пока вы находитесь на странице 4).
Это лучший способ реализовать разбиение на страницы, например, при отложенной загрузке большего количества данных в веб-приложения.
Обратите внимание, что «метод поиска» также называется пейджингом по набору клавиш .