Task 1 by elenachekhina · Pull Request #153 · hardcode-dev/rails-optimization-task1

elenachekhina · 2025-01-28T07:33:00Z

No description provided.

spajic

Nice work, respect!

spajic · 2025-01-28T21:49:04Z

case-study.md

@@ -0,0 +1,150 @@
+# Case-study оптимизации


О, Лена, привет!

spajic · 2025-01-28T21:49:23Z

case-study.md

+
+Она успешно работала на файлах размером пару мегабайт, но для большого файла она работала слишком долго, и не было понятно, закончит ли она вообще работу за какое-то разумное время.
+
+Я решил исправить эту проблему, оптимизировав эту программу.


решила*

spajic · 2025-01-28T21:51:17Z

case-study.md

+## Формирование метрики
+Для того, чтобы понимать, дают ли мои изменения положительный эффект на быстродействие программы я придумал использовать такую метрику:
+- время выполнения должно быть линейным
+- в случае линейности 1_000_000 должен работать не больше 9 секунд


это намного продуманнее того что обычно пишут, но не совсем корректно

то что ты написала, это условие остановки / бюджет, который получен аппроксимацией линейной

Этот вопрос в данном случае tricky. По факту нет простого одного ответа на всю работу. У нас на каждую итерацию оптимизации новая метрика - время работы на файлах разного размера. Когда мы не можем посчитать общую метрику на всю систему / исходную проблему, то мы можем воспользоваться промежуточными метриками. Их функция получается в том, чтобы помочь нам понять, была ли оптимизация успешна на данной итерации.

spajic · 2025-01-28T21:52:53Z

case-study.md

+Программа поставлялась с тестом. Выполнение этого теста в фидбек-лупе позволяет не допустить изменения логики программы при оптимизации.
+
+## Feedback-Loop
+Для того, чтобы иметь возможность быстро проверять гипотезы я выстроил эффективный `feedback-loop`, который позволил мне получать обратную связь по эффективности сделанных изменений за *не поняла как оценить время*


ну я бы тут оценивал сколько у тебя времени уходит на ожидание результата после запуска очередного варианта кода. если это секунд 10-15, то кайф, не нарушается состояние потока

spajic · 2025-01-28T21:53:24Z

case-study.md

+- Время выполнения на 20000: 2.843040
+- Время выполнения на 40000: 12.927038
+
+рост квадратичный -> O(n^2)


spajic · 2025-01-28T21:57:57Z

case-study.md

+### Ваша находка №4
+1) продолжим использовать 640000
+2) в топе самых долгих методов остается collect_stats_from_users (42%), посмотрим внутрь - там метод Date.parse (total 25%)
+3) заметим, что даты приходят в iso8601, поэтому можно опустить парсинг и сразу использовать


пасхалочка

spajic · 2025-01-28T21:58:51Z

case-study.md

+6) поправим тест на перфманс (поставим границу 2.5 с)
+7) проверим время на 1млн: 3.760000
+8) проверим на полном файле: 17.444283 секунд
+9) ради интереса проверим с выключенным gc: ~14 секунд


но чисто ради интереса, а то так и память может кончиться

spajic · 2025-01-28T21:59:09Z

case-study.md

+
+## Результаты
+В результате проделанной оптимизации наконец удалось обработать файл с данными.
+Удалось улучшить метрику системы с ~23ч (предварительная оценка) до ~17.5 сек и уложиться в заданный бюджет.


респект за оценку исходного времени!

spajic · 2025-01-28T22:00:08Z

tests/test-1_spec.rb

+end
+
+describe 'Performance' do
+  it '80_000 works under 0.2s' do


it 'processes 80_000 lines under 0.2s'

spajic · 2025-01-28T22:00:20Z

tests/test-1_spec.rb

+    end.to perform_under(200).ms.warmup(2).times.sample(5).times
+  end
+
+  it 'has linear performance' do


elenachekhina added 9 commits January 25, 2025 14:58

refactoring, complexity

ff34018

move data to folder

0b7e05e

step 1

0a3476b

step 2

ff10bb0

step 3

5823c46

step 4

d2f6731

last step

11179cf

performance spec

eac9d46

report

05ba1ba

spajic approved these changes Jan 28, 2025

View reviewed changes

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Task 1#153

Task 1#153
elenachekhina wants to merge 9 commits intohardcode-dev:masterfrom
elenachekhina:task-1

elenachekhina commented Jan 28, 2025

Uh oh!

spajic left a comment

Uh oh!

spajic Jan 28, 2025

Uh oh!

spajic Jan 28, 2025

Uh oh!

spajic Jan 28, 2025

Uh oh!

spajic Jan 28, 2025

Uh oh!

spajic Jan 28, 2025

Uh oh!

spajic Jan 28, 2025

Uh oh!

spajic Jan 28, 2025

Uh oh!

spajic Jan 28, 2025

Uh oh!

spajic Jan 28, 2025

Uh oh!

spajic Jan 28, 2025

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants


		Она успешно работала на файлах размером пару мегабайт, но для большого файла она работала слишком долго, и не было понятно, закончит ли она вообще работу за какое-то разумное время.

		Я решил исправить эту проблему, оптимизировав эту программу.

Conversation

elenachekhina commented Jan 28, 2025

Uh oh!

spajic left a comment

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Choose a reason for hiding this comment

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

2 participants