• Курсы Академии Кодебай, стартующие в мае - июне, от команды The Codeby

    1. Цифровая криминалистика и реагирование на инциденты
    2. ОС Linux (DFIR) Старт: 16 мая
    3. Анализ фишинговых атак Старт: 16 мая Устройства для тестирования на проникновение Старт: 16 мая

    Скидки до 10%

    Полный список ближайших курсов ...

Проблема Многопоточность Python

komodikus

Green Team
06.01.2017
40
79
BIT
0
Всем привет. Возник вопрос.

Я для себя пишу программу которая сверяет строки на дубликаты двух файлов. и потом выводиться файл без дублей. на маленьких размерах работает неплохо. но если кидаешь тхт размером допустим 100 мб. то оно просто будет делаться год. я так понял что надо несколько потоков делать.

но как это реализовать не совсем понятно. В гугле написано сложно. Если тут есть кто может это обьяснить человеческим языком. Напишите пожалуйста в коментариях попростому )
 

Tayler

Green Team
08.07.2017
40
46
BIT
1
И без потоков нормально работать будет...

Python:
file_1 = open(input('Input Name 1 file: '),'r').readlines()
file_2 = open(input('Input Name 2 file: '),'r').readlines()

if '\n' not in file_1[-1]: file_1.append(file_1.pop()+'\n')
if '\n' not in file_2[-1]: file_2.append(file_2.pop()+'\n')

result = list(set(file_1) ^ set(file_2))
open(input('Input result file name: '),'a').write(''.join(result))
А что бы тебе помогли с потоками,то привел бы хоть кусок кода.
 
Последнее редактирование:
  • Нравится
Реакции: darklight

dirtyharry

Green Team
25.11.2017
13
54
BIT
0
А чем BASH не подошел?

Bash:
cat file1.txt >> file2.txt | sort -u file2.txt -o file3.txt
 
  • Нравится
Реакции: rukhem
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!