Ступор по I/O [Решено]
[Проблема была в trim]
Итак,
3.7.10-gentoo #5 SMP Sun Mar 3 16:50:39 MSK 2013 x86_64 Intel(R) Core(TM) i5-2400S CPU @ 2.50GHz GenuineIntel GNU/Linux
/dev/sda1 on / type ext4 (rw,mand,noatime,nodiratime,discard,commit=120,data=ordered)
при попытке удалить директорию с большим количеством вложенных директорий или файликов (пока не уловил зависимость, но проявляется на удалении кеша nginx или squid) происходит остановка системы на некоторое время. Умирает абсолютно все и на системнике ровным светом горит диод доступа к диску, может пару-тройку минут гореть. Потом все, что выдержало таймаут, продолжает свою работу. Работает опять до тех пор, пока не поработает удаление директорий дальше. Т.е. удаляет, удаляет, хлоп - стоим... И так в цикле. При обычной работе ничего подобного не проявляется.
Ядро менялось с тех пор, как поставил SSD, на этом ядре перешел с дров чипсета на AHCI - так же все.
Есть какие-то предположения, как избежать этих зависаний?
smartctl 5.42 2011-10-20 r3458 [x86_64-linux-3.7.10-gentoo] (local build) Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net === START OF INFORMATION SECTION === Device Model: INTEL SSDSC2CW240A3 Serial Number: CVCV249504TM240CGN LU WWN Device Id: 5 001517 803d14cc3 Firmware Version: 400i User Capacity: 240 057 409 536 bytes [240 GB] Sector Size: 512 bytes logical/physical Device is: Not in smartctl database [for details use: -P showall] ATA Version is: 8 ATA Standard is: ACS-2 revision 3 Local Time is: Tue Mar 12 12:53:03 2013 MSK SMART support is: Available - device has SMART capability. SMART support is: Enabled === START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED General SMART Values: Offline data collection status: (0x00) Offline data collection activity was never started. Auto Offline Data Collection: Disabled. Self-test execution status: ( 0) The previous self-test routine completed without error or no self-test has ever been run. Total time to complete Offline data collection: ( 2097) seconds. Offline data collection capabilities: (0x7f) SMART execute Offline immediate. Auto Offline data collection on/off support. Abort Offline collection upon new command. Offline surface scan supported. Self-test supported. Conveyance Self-test supported. Selective Self-test supported. SMART capabilities: (0x0003) Saves SMART data before entering power-saving mode. Supports SMART auto save timer. Error logging capability: (0x01) Error logging supported. General Purpose Logging supported. Short self-test routine recommended polling time: ( 1) minutes. Extended self-test routine recommended polling time: ( 48) minutes. Conveyance self-test routine recommended polling time: ( 2) minutes. SCT capabilities: (0x0021) SCT Status supported. SCT Data Table supported. SMART Attributes Data Structure revision number: 10 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE 5 Reallocated_Sector_Ct 0x0032 100 100 000 Old_age Always - 0 9 Power_On_Hours 0x0032 000 000 000 Old_age Always - 158020437650379 12 Power_Cycle_Count 0x0032 100 100 000 Old_age Always - 10 170 Unknown_Attribute 0x0033 100 100 010 Pre-fail Always - 0 171 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 172 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 0 174 Unknown_Attribute 0x0032 100 100 000 Old_age Always - 10 184 End-to-End_Error 0x0033 100 100 090 Pre-fail Always - 0 187 Reported_Uncorrect 0x0032 100 100 000 Old_age Always - 0 192 Power-Off_Retract_Count 0x0032 100 100 000 Old_age Always - 10 225 Load_Cycle_Count 0x0032 100 100 000 Old_age Always - 17041 226 Load-in_Time 0x0032 100 100 000 Old_age Always - 65535 227 Torq-amp_Count 0x0032 100 100 000 Old_age Always - 44 228 Power-off_Retract_Count 0x0032 100 100 000 Old_age Always - 65535 232 Available_Reservd_Space 0x0033 100 100 010 Pre-fail Always - 0 233 Media_Wearout_Indicator 0x0032 100 100 000 Old_age Always - 0 241 Total_LBAs_Written 0x0032 100 100 000 Old_age Always - 17041 242 Total_LBAs_Read 0x0032 100 100 000 Old_age Always - 13837 249 Unknown_Attribute 0x0013 100 100 000 Pre-fail Always - 623 SMART Error Log not supported SMART Self-test Log not supported Note: selective self-test log revision number (0) not 1 implies that no selective self-test has ever been run SMART Selective self-test log data structure revision number 0 Note: revision number not 1 implies that no selective self-test has ever been run SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS 1 0 0 Not_testing 2 0 0 Not_testing 3 0 0 Not_testing 4 0 0 Not_testing 5 0 0 Not_testing Selective self-test flags (0x0): After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.
- Для комментирования войдите или зарегистрируйтесь
Да, диск не
Да, диск не забит...
/dev/sda1 221G 12G 198G 6% /
http://olegon.ru
.
Olegon, мона спросить?
А зачем на корне
-o mand
, еслиЯ лично ничего против этого не имею, токмо ради интереса.
Спасибо :) Не знаю,
Спасибо :) Не знаю, исторически возникла.
http://olegon.ru
вот тут
вот тут http://habrahabr.ru/post/157613/ есть метод борьбы
Дело не в том, чтобы
Дело не в том, чтобы дождаться удаления, а в том, почему машина при этом вешается. Сейчас есть подозрения на работу trim, в ближайшие выходные проверю работу без него и ежедневным запуском fstrim
http://olegon.ru
Не знаю, имеет ли это
Не знаю, имеет ли это отношение к данной ситуации, но я уже много раз сталкивался с тем, что большая дисковая активность тормозит все процессы которые пытаются с диском общаться. К примеру, когда я запускаю создание файла гигабайт на 30, с обязательным обнулением, то подвисают возможности залогиниться, или запустить ls. Однако программы не обращающиеся к диску при этом работают. На сколько я понимаю, просто диск не успевает реагировать на запросы ядра, в результате все процессы подвисают со статусом D.
Чем больше юзерфрендли, тем сложнее юзать.
Это должен разруливать
Это должен разруливать планировщик ввода-вывода. Попробуйте разные, возможно "один из" даст нужный Вам результат.