Найти одинаковые позиции
Автор Alksprin, 7 июня 2011, 15:10
0 Пользователи и 1 гость просматривают эту тему.
Добрый день! Скажите, а как можно быстро и удобно найти одинаковые позиции (найти и удалить дубликат) в большом документе, чтобы не просматривать весь список вручную? Спасибо!
2 вспомогательные колонки, в одной номера от 1 до N, в другой результат сравнения интересующего поля с предыдущей строкой.
Сортируем по интересующей колонке, фильтруем по колонке сравнения — получили дубликаты.
Сортируем по колонке с номерами — восстановили первоначальный порядок.
Или Данные-Фильтр-Стандартный фильтр в Детали флажок «Без повторений»
Цитата: JohnSUN от 7 июня 2011, 18:38Сортируем по интересующей колонке, фильтруем по колонке сравнения — получили дубликаты.
а если мне перед тем как удалить, а в моем случае мне не надо удалять, а надо найти и увидеть повторы?
Пример.
У меня 39939 строк, файл вытянут из 1с.
Там номера возвратных накладных за 4 года. Номера часто совпадают от разных клиентов хотя бы два раза. То есть, есть и уникальные, но есть и повторы. Мне нужно их увидеть, определить каким контрагентам принадлежит одинаковый номер накладной.
Самое простое это я сделала сводную и путем кнтл+вниз определяла пустую ячейку, то есть где под номером есть пустая ячейка — значит на этот номер две накладные. Но я даже половину не просмотрела. Может можно проще это сделать?
Если без привязки к клиенту, просто «дубль/не дубль», то в условном форматировании есть специальное условие (см. картинку). Но все дубли будут одним цветом.
Если хочется разными цветами — то что-то похожее см.
здесь
(если повторов будет много, то в глазах зарябит от попугаистости)
Если нужно просто увидеть, то можно использовать готовый VBA-макрос (вложение). Выделили диапазон, запустили, увидели «радугу» на дублях.
Фильтра и Сортировки по цвету в Calc как в MS Excel ещё, увы, нет. Кстати, одно из самых частых у моих пользователей «пожеланий».
Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, —
Не понять его никак…
Цитата: JohnSUN от 19 июня 2018, 10:47то в условном форматировании есть специальное условие
сколько пользовалась форматированием не сообразила и не видела это условие)) присмотрюсь к остальным) спасибо большое))
Download Article
An easy-to-follow guide on hiding duplicates in Open Office Calc
Download Article
When you are using OpenOffice Calc for its ability to create orderly lists, you might want to be able to get rid of duplicates. While it isn’t as quick and easy as it is in MS Excel, it is possible.
Read on to learn how to do it.
-
1
Paste the list that you will want to filter into OOo Calc.
-
2
Select the data that you want to filter. After that Go to Data >> Filter >> Standard Filter.
Advertisement
-
3
Click on More Options. This will take you to more advanced options.
-
4
Click on No Duplicates. Change Field Name to ‘none’. If you want to create a separate list, click on Copy To… and select a cell address; such as B1.
-
5
Select Ok. You will be taken back to your list with the duplicates removed.
Advertisement
Ask a Question
200 characters left
Include your email address to get a message when this question is answered.
Submit
Advertisement
Video
Thanks for submitting a tip for review!
References
- Original information cames from OpenOffice.org
About This Article
Thanks to all authors for creating a page that has been read 215,855 times.
Is this article up to date?
wikiHow Tech Help:
Tech troubles got you down? We’ve got the tips you need
Subscribe
You’re all set!
Подробности
- Подробности
- Категория: OpenOffice Calc
- Просмотров: 41901
Иногда необходимо проанализировать большой объем данных, на наличие дубликатов. Когда ячеек 10 – 20 – это не проблема, а что делать, когда ячеек 100, 500 или тысячи?
В OpenOffice Calc нет функции, которая бы делала это автоматически. Но есть не сложный выход из ситуации.
1. Выполним сортировку столбца, для этого выделим все ячейки столбца и нажмем в меню данные->сортировка и ок.
2. В первой правой ячейке столбца пишем формулу
=IF(A1=A2;1;0)
, для того чтобы определить, не дублируются ли две первые ячейки. Если 1, то значит поля идентичны, если 0, то значение уникально. Повторяем эту формулу для всех ячеек. Для этого можно просто выделить ячейку с формулой и перетянуть ее за правый нижний край до конца столбца.
4. Теперь необходимо скопировать полученную таблицу и вставить как числа. Для этого копируем столбец и вставляем через меню Правка-> Вставить как (либо через сочетание клавиш ctrl+shift+v). После чего можно удалить колонку с формулами.
5. Нам осталось отсортировать данные по полученной колонке и удалить дубликаты. Для этого выделяем обе колонки и в меню выбираем Данные-> Сортировка и сортируем по новой колонке. Осталось удалить все строки, содержащие ячейки со значением 1 (т.е. дублирующиеся).
Удаляем лишнюю колонку и у нас остается колонка с уникальными значениями.
Похожие статьи Удаление дубликатов в Microsoft Office Excel.
Добавить комментарий
Для того, чтобы удалить дубликаты или повторы строк в программе Calc OpenOffice нужно сделать следующее:
Выделите ячейки, уникализацию которых нужно сделать, или сразу целый столбец.
Выберите пункт меню «Данные» > «Фильтр»> «Стандартный фильтр» («Data» > «Filter» > «Standard Filter»).
Установите правило вида: «поле1 = Не пусто» («field1 = Not empty»).
В пункте «Расширенные» («More») нужно отметить чекбокс «Удалить Дубликаты» («Remove Duplicate»).
Нажимаем Ок, и в выделенных ячейках дубликаты и повторы строк (одинаковые ячейки) будут удалены.
Не совсем решение этого конкретного вопроса, но я считаю, что следующее очень удобно, когда у вас отсортирован столбец, особенно если вы сортируете по нескольким столбцам:
Если вы хотите отформатировать любое значение в ячейке, которая является дубликатом ячейки, расположенной непосредственно над ней, выберите весь столбец и используйте следующую формулу в Условном форматировании
(INDIRECT(CELL("address"))=OFFSET(INDIRECT(CELL("address"));-1;0))
В отсортированном столбце первое вхождение значения будет считаться «уникальным» в том смысле, что оно еще не произошло, а затем все дубликаты, которые следуют сразу после этого, помечаются (я обычно использую светло-серый цвет шрифта), Если столбец не является основным порядком (т. Е. 2-м или более поздним в критериях сортировки), тогда «уникальность» фактически «сбрасывается» каждый раз, когда сортировка начинается для этого столбца.