Как случайным образом выбирать строки в SQL?
Я использую MSSQL Server 2005. В моей базе данных у меня есть таблица «customerNames», в которой есть два столбца «Id» и «Name» и прибл. 1000 результатов.
Я создаю функционал, в котором мне каждый раз приходится выбирать 5 клиентов случайным образом. Может ли кто-нибудь сказать мне, как создать запрос, который будет получать 5 случайных строк (Id и Name) каждый раз при выполнении запроса?
Ответов (12)12
SELECT TOP 5 Id, Name FROM customerNames
ORDER BY NEWID()
Тем не менее, похоже, что все приходят на эту страницу, чтобы получить более общий ответ на ваш вопрос:
Выбор случайной строки в SQL
Выберите случайную строку с MySQL:
SELECT column FROM table
ORDER BY RAND()
LIMIT 1
Выберите случайную строку с PostgreSQL:
SELECT column FROM table
ORDER BY RANDOM()
LIMIT 1
Выберите случайную строку с Microsoft SQL Server:
SELECT TOP 1 column FROM table
ORDER BY NEWID()
Выберите случайную строку с IBM DB2
SELECT column, RAND() as IDX
FROM table
ORDER BY IDX FETCH FIRST 1 ROWS ONLY
Выберите случайную запись с Oracle:
SELECT column FROM
( SELECT column FROM table
ORDER BY dbms_random.value )
WHERE rownum = 1
Выберите случайную строку с помощью sqlite:
SELECT column FROM table
ORDER BY RANDOM() LIMIT 1
Здесь есть хорошее решение для Microsoft SQL Server 2005. Имеет дело с проблемой, когда вы работаете с большим набором результатов (вопрос, который мне неизвестен).
Случайный выбор строк из большой таблицы http://msdn.microsoft.com/en-us/library/cc441928.aspx
Я обнаружил, что это лучше всего подходит для больших данных.
SELECT TOP 1 Column_Name FROM dbo.Table TABLESAMPLE(1 PERCENT);
TABLESAMPLE(n ROWS) or TABLESAMPLE(n PERCENT)
является случайным, но необходимо добавить, TOP n
чтобы получить правильный размер выборки.
Использование NEWID()
очень медленное на больших таблицах.
Это старый вопрос, но попытка применить новое поле (NEWID () или ORDER BY rand ()) к таблице с большим количеством строк будет непомерно дорогостоящим. Если у вас есть инкрементные уникальные идентификаторы (и нет никаких дыр), будет более эффективным вычислить X # идентификаторов, которые будут выбраны, вместо того, чтобы применять GUID или аналогичный к каждой отдельной строке, а затем брать верхние X # из.
DECLARE @minValue int;
DECLARE @maxValue int;
SELECT @minValue = min(id), @maxValue = max(id) from [TABLE];
DECLARE @randomId1 int, @randomId2 int, @randomId3 int, @randomId4 int, @randomId5 int
SET @randomId1 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId2 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId3 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId4 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId5 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
--select @maxValue as MaxValue, @minValue as MinValue
-- , @randomId1 as SelectedId1
-- , @randomId2 as SelectedId2
-- , @randomId3 as SelectedId3
-- , @randomId4 as SelectedId4
-- , @randomId5 as SelectedId5
select * from [TABLE] el
where el.id in (@randomId1, @randomId2, @randomId3, @randomId4, @randomId5)
Если вы хотите выбрать намного больше строк, я бы посмотрел на заполнение #tempTable идентификатором и кучей значений rand (), а затем с использованием каждого значения rand () для масштабирования до значений min-max. Таким образом, вам не нужно определять все параметры @ randomId1 ... n. Ниже я привел пример использования CTE для заполнения исходной таблицы.
DECLARE @NumItems int = 100;
DECLARE @minValue int;
DECLARE @maxValue int;
SELECT @minValue = min(id), @maxValue = max(id) from [TABLE];
DECLARE @range int = @maxValue+1 - @minValue;
with cte (n) as (
select 1 union all
select n+1 from cte
where n < @NumItems
)
select cast( @range * rand(cast(newid() as varbinary(100))) + @minValue as int) tp
into #Nt
from cte;
select * from #Nt ntt
inner join [TABLE] i on i.id = ntt.tp;
drop table #Nt;
Чтобы перемешать набор результатов SQL, необходимо использовать вызов функции, специфичной для базы данных.
Обратите внимание, что сортировка большого набора результатов с использованием функции RANDOM может оказаться очень медленной, поэтому убедитесь, что вы делаете это для небольших наборов результатов.
Если вам нужно перетасовать большой набор результатов и затем ограничить его, тогда лучше использовать что-то вроде Oracle
SAMPLE(N)
илиTABLESAMPLE
в SQL Server или PostgreSQL вместо случайной функции в предложении ORDER BY.
Итак, предположим, что у нас есть следующая таблица базы данных:
И следующие строки в song
таблице:
| id | artist | title |
|----|---------------------------------|------------------------------------|
| 1 | Miyagi & Эндшпиль ft. Рем Дигга | I Got Love |
| 2 | HAIM | Don't Save Me (Cyril Hahn Remix) |
| 3 | 2Pac ft. DMX | Rise Of A Champion (GalilHD Remix) |
| 4 | Ed Sheeran & Passenger | No Diggity (Kygo Remix) |
| 5 | JP Cooper ft. Mali-Koa | All This Love |
Oracle
В Oracle вам необходимо использовать эту DBMS_RANDOM.VALUE
функцию, как показано в следующем примере:
SELECT
artist||' - '||title AS song
FROM song
ORDER BY DBMS_RANDOM.VALUE
При выполнении вышеупомянутого SQL-запроса в Oracle мы получим следующий набор результатов:
| song |
|---------------------------------------------------|
| JP Cooper ft. Mali-Koa - All This Love |
| 2Pac ft. DMX - Rise Of A Champion (GalilHD Remix) |
| HAIM - Don't Save Me (Cyril Hahn Remix) |
| Ed Sheeran & Passenger - No Diggity (Kygo Remix) |
| Miyagi & Эндшпиль ft. Рем Дигга - I Got Love |
Обратите внимание, что песни перечислены в случайном порядке благодаря
DBMS_RANDOM.VALUE
вызову функции, используемому предложением ORDER BY.
SQL Server
В SQL Server вам необходимо использовать эту NEWID
функцию, как показано в следующем примере:
SELECT
CONCAT(CONCAT(artist, ' - '), title) AS song
FROM song
ORDER BY NEWID()
При выполнении вышеупомянутого SQL-запроса на SQL Server мы получим следующий набор результатов:
| song |
|---------------------------------------------------|
| Miyagi & Эндшпиль ft. Рем Дигга - I Got Love |
| JP Cooper ft. Mali-Koa - All This Love |
| HAIM - Don't Save Me (Cyril Hahn Remix) |
| Ed Sheeran & Passenger - No Diggity (Kygo Remix) |
| 2Pac ft. DMX - Rise Of A Champion (GalilHD Remix) |
Обратите внимание, что песни перечислены в случайном порядке благодаря
NEWID
вызову функции, используемому предложением ORDER BY.
PostgreSQL
В PostgreSQL вам необходимо использовать эту random
функцию, как показано в следующем примере:
SELECT
artist||' - '||title AS song
FROM song
ORDER BY random()
При выполнении вышеупомянутого SQL-запроса в PostgreSQL мы получим следующий набор результатов:
| song |
|---------------------------------------------------|
| 2Pac ft. DMX - Rise Of A Champion (GalilHD Remix) |
| JP Cooper ft. Mali-Koa - All This Love |
| Ed Sheeran & Passenger - No Diggity (Kygo Remix) |
| HAIM - Don't Save Me (Cyril Hahn Remix) |
| Miyagi & Эндшпиль ft. Рем Дигга - I Got Love |
Обратите внимание, что песни перечислены в случайном порядке благодаря
random
вызову функции, используемому предложением ORDER BY.
MySQL
В MySQL вам необходимо использовать эту RAND
функцию, как показано в следующем примере:
SELECT
CONCAT(CONCAT(artist, ' - '), title) AS song
FROM song
ORDER BY RAND()
При выполнении вышеупомянутого SQL-запроса в MySQL мы получим следующий набор результатов:
| song |
|---------------------------------------------------|
| HAIM - Don't Save Me (Cyril Hahn Remix) |
| Ed Sheeran & Passenger - No Diggity (Kygo Remix) |
| Miyagi & Эндшпиль ft. Рем Дигга - I Got Love |
| 2Pac ft. DMX - Rise Of A Champion (GalilHD Remix) |
| JP Cooper ft. Mali-Koa - All This Love |
Обратите внимание, что песни перечислены в случайном порядке благодаря
RAND
вызову функции, используемому предложением ORDER BY.
Может быть, этот сайт вам поможет.
Для тех, кто не хочет переходить по ссылкам:
SELECT TOP 1 column FROM table
ORDER BY NEWID()