Skip to content

Conversation

@yarafan
Copy link

@yarafan yarafan commented Mar 6, 2019

No description provided.

Copy link
Owner

@spajic spajic left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Аппрув + несколько комментов.
Было бы хорошо более конкретно расписывать шаги оптимизации.
Каким инструментом нашли самую жирную проблему, в чём была причина, как её исправили, как повлияло на метрику.

Вот как я построил `feedback_loop`:
1. Изначально выбрал маленький размер исходных данных (около 1Мб) позволяющий скрипту успешно отработать без оптимизаций
2. Поиск базовой метрики (время и память)
3. Дописал тест на регрессию по времени и памяти
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

👍

### Ваша находка №1
О вашей находке №1
### Находка №1
Считывание всего файла в строку с дальнейшим разбиением на массив строк крайне неэффективно и было одним из основным блокеров для работы с большими файлами
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Опечатка одним из основных

### Ваша находка №1
О вашей находке №1
### Находка №1
Считывание всего файла в строку с дальнейшим разбиением на массив строк крайне неэффективно и было одним из основным блокеров для работы с большими файлами
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Как именно это обнаружили?

### Находка №2
Memory_profiler показал, что аллоцируется огромное количество строк, хоть большинство из них собираются GC, однако все равно увеличивают объем потребляемой памяти и время выполнения (как минимум за счет работы GC)

Для исправления этой проблемы был использован ```# frozen_string_literal: true``` и в качестве ключей стали использоваться Symbol
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Насколько сильно помогло?
Как повлияло на метрики?

### Находка №6
Использование "медленных" методов без особой надобности

Ruby-prof показал, что метод Date#parse занимает порядка 8% от всего времени выполнения, поэтому он был заменен на Date#strptime
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

👍

Удалось улучшить метрику системы с *того, что у вас было в начале, до того, что получилось в конце*

*Какими ещё результами можете поделиться*
В среднем файл обрабатывается за 29 - 30 секунд при средних затратах по памяти 850 - 860Мб
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

👍

@@ -1,60 +1,50 @@
# Deoptimized version of homework task
# frozen_string_literal: true
Copy link
Owner

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

👍

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants