Как случайным образом выбирать строки в SQL?

Я использую MSSQL Server 2005. В моей базе данных у меня есть таблица «customerNames», в которой есть два столбца «Id» и «Name» и прибл. 1000 результатов.

Я создаю функционал, в котором мне каждый раз приходится выбирать 5 клиентов случайным образом. Может ли кто-нибудь сказать мне, как создать запрос, который будет получать 5 случайных строк (Id и Name) каждый раз при выполнении запроса?

Ответов (12)

Решение
SELECT TOP 5 Id, Name FROM customerNames
ORDER BY NEWID()

Тем не менее, похоже, что все приходят на эту страницу, чтобы получить более общий ответ на ваш вопрос:

Выбор случайной строки в SQL

Выберите случайную строку с MySQL:

SELECT column FROM table
ORDER BY RAND()
LIMIT 1

Выберите случайную строку с PostgreSQL:

SELECT column FROM table
ORDER BY RANDOM()
LIMIT 1

Выберите случайную строку с Microsoft SQL Server:

SELECT TOP 1 column FROM table
ORDER BY NEWID()

Выберите случайную строку с IBM DB2

SELECT column, RAND() as IDX 
FROM table 
ORDER BY IDX FETCH FIRST 1 ROWS ONLY

Выберите случайную запись с Oracle:

SELECT column FROM
( SELECT column FROM table
ORDER BY dbms_random.value )
WHERE rownum = 1

Выберите случайную строку с помощью sqlite:

SELECT column FROM table 
ORDER BY RANDOM() LIMIT 1
SELECT TOP 5 Id, Name FROM customerNames ORDER BY NEWID()

Если кому-то нужно решение PostgreSQL:

select id, name
from customer
order by random()
limit 5;

Здесь есть хорошее решение для Microsoft SQL Server 2005. Имеет дело с проблемой, когда вы работаете с большим набором результатов (вопрос, который мне неизвестен).

Случайный выбор строк из большой таблицы http://msdn.microsoft.com/en-us/library/cc441928.aspx

SELECT * FROM TABLENAME ORDER BY random() LIMIT 5; 

Я обнаружил, что это лучше всего подходит для больших данных.

SELECT TOP 1 Column_Name FROM dbo.Table TABLESAMPLE(1 PERCENT);

TABLESAMPLE(n ROWS) or TABLESAMPLE(n PERCENT) является случайным, но необходимо добавить, TOP n чтобы получить правильный размер выборки.

Использование NEWID() очень медленное на больших таблицах.

Это старый вопрос, но попытка применить новое поле (NEWID () или ORDER BY rand ()) к таблице с большим количеством строк будет непомерно дорогостоящим. Если у вас есть инкрементные уникальные идентификаторы (и нет никаких дыр), будет более эффективным вычислить X # идентификаторов, которые будут выбраны, вместо того, чтобы применять GUID или аналогичный к каждой отдельной строке, а затем брать верхние X # из.

DECLARE @minValue int;
DECLARE @maxValue int;
SELECT @minValue = min(id), @maxValue = max(id) from [TABLE];

DECLARE @randomId1 int, @randomId2 int, @randomId3 int, @randomId4 int, @randomId5 int
SET @randomId1 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId2 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId3 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId4 = ((@maxValue + 1) - @minValue) * Rand() + @minValue
SET @randomId5 = ((@maxValue + 1) - @minValue) * Rand() + @minValue

--select @maxValue as MaxValue, @minValue as MinValue
--  , @randomId1 as SelectedId1
--  , @randomId2 as SelectedId2
--  , @randomId3 as SelectedId3
--  , @randomId4 as SelectedId4
--  , @randomId5 as SelectedId5

select * from [TABLE] el
where el.id in (@randomId1, @randomId2, @randomId3, @randomId4, @randomId5)

Если вы хотите выбрать намного больше строк, я бы посмотрел на заполнение #tempTable идентификатором и кучей значений rand (), а затем с использованием каждого значения rand () для масштабирования до значений min-max. Таким образом, вам не нужно определять все параметры @ randomId1 ... n. Ниже я привел пример использования CTE для заполнения исходной таблицы.

DECLARE @NumItems int = 100;

DECLARE @minValue int;
DECLARE @maxValue int;
SELECT @minValue = min(id), @maxValue = max(id) from [TABLE];
DECLARE @range int = @maxValue+1 - @minValue;

with cte (n) as (
   select 1 union all
   select n+1 from cte
   where n < @NumItems
)
select cast( @range * rand(cast(newid() as varbinary(100))) + @minValue as int) tp
into #Nt
from cte;

select * from #Nt ntt
inner join [TABLE] i on i.id = ntt.tp;

drop table #Nt;

Если вы используете большую таблицу и хотите получить доступ к 10 процентам данных, выполните следующую команду: SELECT TOP 10 PERCENT * FROM Table1 ORDER BY NEWID();

Если вы используете базу данных Яндекса, вам следует использовать

select column from table order by random (TableRow()) limit 1;

Чтобы перемешать набор результатов SQL, необходимо использовать вызов функции, специфичной для базы данных.

Обратите внимание, что сортировка большого набора результатов с использованием функции RANDOM может оказаться очень медленной, поэтому убедитесь, что вы делаете это для небольших наборов результатов.

Если вам нужно перетасовать большой набор результатов и затем ограничить его, тогда лучше использовать что-то вроде OracleSAMPLE(N) или TABLESAMPLEв SQL Server или PostgreSQL вместо случайной функции в предложении ORDER BY.

Итак, предположим, что у нас есть следующая таблица базы данных:

Таблица базы данных песен

И следующие строки в song таблице:

| id | artist                          | title                              |
|----|---------------------------------|------------------------------------|
| 1  | Miyagi & Эндшпиль ft. Рем Дигга | I Got Love                         |
| 2  | HAIM                            | Don't Save Me (Cyril Hahn Remix)   |
| 3  | 2Pac ft. DMX                    | Rise Of A Champion (GalilHD Remix) |
| 4  | Ed Sheeran & Passenger          | No Diggity (Kygo Remix)            |
| 5  | JP Cooper ft. Mali-Koa          | All This Love                      |

Oracle

В Oracle вам необходимо использовать эту DBMS_RANDOM.VALUE функцию, как показано в следующем примере:

SELECT
    artist||' - '||title AS song
FROM song
ORDER BY DBMS_RANDOM.VALUE

При выполнении вышеупомянутого SQL-запроса в Oracle мы получим следующий набор результатов:

| song                                              |
|---------------------------------------------------|
| JP Cooper ft. Mali-Koa - All This Love            |
| 2Pac ft. DMX - Rise Of A Champion (GalilHD Remix) |
| HAIM - Don't Save Me (Cyril Hahn Remix)           |
| Ed Sheeran & Passenger - No Diggity (Kygo Remix)  |
| Miyagi & Эндшпиль ft. Рем Дигга - I Got Love      |

Обратите внимание, что песни перечислены в случайном порядке благодаря DBMS_RANDOM.VALUEвызову функции, используемому предложением ORDER BY.

SQL Server

В SQL Server вам необходимо использовать эту NEWID функцию, как показано в следующем примере:

SELECT
    CONCAT(CONCAT(artist, ' - '), title) AS song
FROM song
ORDER BY NEWID()

При выполнении вышеупомянутого SQL-запроса на SQL Server мы получим следующий набор результатов:

| song                                              |
|---------------------------------------------------|
| Miyagi & Эндшпиль ft. Рем Дигга - I Got Love      |
| JP Cooper ft. Mali-Koa - All This Love            |
| HAIM - Don't Save Me (Cyril Hahn Remix)           |
| Ed Sheeran & Passenger - No Diggity (Kygo Remix)  |
| 2Pac ft. DMX - Rise Of A Champion (GalilHD Remix) |

Обратите внимание, что песни перечислены в случайном порядке благодаря NEWIDвызову функции, используемому предложением ORDER BY.

PostgreSQL

В PostgreSQL вам необходимо использовать эту random функцию, как показано в следующем примере:

SELECT
    artist||' - '||title AS song
FROM song
ORDER BY random()

При выполнении вышеупомянутого SQL-запроса в PostgreSQL мы получим следующий набор результатов:

| song                                              |
|---------------------------------------------------|
| 2Pac ft. DMX - Rise Of A Champion (GalilHD Remix) |
| JP Cooper ft. Mali-Koa - All This Love            |
| Ed Sheeran & Passenger - No Diggity (Kygo Remix)  |
| HAIM - Don't Save Me (Cyril Hahn Remix)           |
| Miyagi & Эндшпиль ft. Рем Дигга - I Got Love      |

Обратите внимание, что песни перечислены в случайном порядке благодаря randomвызову функции, используемому предложением ORDER BY.

MySQL

В MySQL вам необходимо использовать эту RAND функцию, как показано в следующем примере:

SELECT
  CONCAT(CONCAT(artist, ' - '), title) AS song
FROM song
ORDER BY RAND()

При выполнении вышеупомянутого SQL-запроса в MySQL мы получим следующий набор результатов:

| song                                              |
|---------------------------------------------------|
| HAIM - Don't Save Me (Cyril Hahn Remix)           |
| Ed Sheeran & Passenger - No Diggity (Kygo Remix)  |
| Miyagi & Эндшпиль ft. Рем Дигга - I Got Love      |
| 2Pac ft. DMX - Rise Of A Champion (GalilHD Remix) |
| JP Cooper ft. Mali-Koa - All This Love            |

Обратите внимание, что песни перечислены в случайном порядке благодаря RANDвызову функции, используемому предложением ORDER BY.

Если у вас есть таблица с миллионами строк и вы заботитесь о производительности, это может быть лучшим ответом:

SELECT * FROM Table1
WHERE (ABS(CAST(
  (BINARY_CHECKSUM
  (keycol1, NEWID())) as int))
  % 100) < 10

https://msdn.microsoft.com/en-us/library/cc441928.aspx

Может быть, этот сайт вам поможет.

Для тех, кто не хочет переходить по ссылкам:

SELECT TOP 1 column FROM table
ORDER BY NEWID()