Ступор по I/O [Решено]

[Проблема была в trim]

Итак,
3.7.10-gentoo #5 SMP Sun Mar 3 16:50:39 MSK 2013 x86_64 Intel(R) Core(TM) i5-2400S CPU @ 2.50GHz GenuineIntel GNU/Linux

/dev/sda1 on / type ext4 (rw,mand,noatime,nodiratime,discard,commit=120,data=ordered)

при попытке удалить директорию с большим количеством вложенных директорий или файликов (пока не уловил зависимость, но проявляется на удалении кеша nginx или squid) происходит остановка системы на некоторое время. Умирает абсолютно все и на системнике ровным светом горит диод доступа к диску, может пару-тройку минут гореть. Потом все, что выдержало таймаут, продолжает свою работу. Работает опять до тех пор, пока не поработает удаление директорий дальше. Т.е. удаляет, удаляет, хлоп - стоим... И так в цикле. При обычной работе ничего подобного не проявляется.
Ядро менялось с тех пор, как поставил SSD, на этом ядре перешел с дров чипсета на AHCI - так же все.
Есть какие-то предположения, как избежать этих зависаний?

smartctl 5.42 2011-10-20 r3458 [x86_64-linux-3.7.10-gentoo] (local build)
Copyright (C) 2002-11 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     INTEL SSDSC2CW240A3
Serial Number:    CVCV249504TM240CGN
LU WWN Device Id: 5 001517 803d14cc3
Firmware Version: 400i
User Capacity:    240 057 409 536 bytes [240 GB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   8
ATA Standard is:  ACS-2 revision 3
Local Time is:    Tue Mar 12 12:53:03 2013 MSK
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00)	Offline data collection activity
					was never started.
					Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0)	The previous self-test routine completed
					without error or no self-test has ever 
					been run.
Total time to complete Offline 
data collection: 		( 2097) seconds.
Offline data collection
capabilities: 			 (0x7f) SMART execute Offline immediate.
					Auto Offline data collection on/off support.
					Abort Offline collection upon new
					command.
					Offline surface scan supported.
					Self-test supported.
					Conveyance Self-test supported.
					Selective Self-test supported.
SMART capabilities:            (0x0003)	Saves SMART data before entering
					power-saving mode.
					Supports SMART auto save timer.
Error logging capability:        (0x01)	Error logging supported.
					General Purpose Logging supported.
Short self-test routine 
recommended polling time: 	 (   1) minutes.
Extended self-test routine
recommended polling time: 	 (  48) minutes.
Conveyance self-test routine
recommended polling time: 	 (   2) minutes.
SCT capabilities: 	       (0x0021)	SCT Status supported.
					SCT Data Table supported.

SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0032   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   000   000   000    Old_age   Always       -       158020437650379
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       10
170 Unknown_Attribute       0x0033   100   100   010    Pre-fail  Always       -       0
171 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
172 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       0
174 Unknown_Attribute       0x0032   100   100   000    Old_age   Always       -       10
184 End-to-End_Error        0x0033   100   100   090    Pre-fail  Always       -       0
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
192 Power-Off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       10
225 Load_Cycle_Count        0x0032   100   100   000    Old_age   Always       -       17041
226 Load-in_Time            0x0032   100   100   000    Old_age   Always       -       65535
227 Torq-amp_Count          0x0032   100   100   000    Old_age   Always       -       44
228 Power-off_Retract_Count 0x0032   100   100   000    Old_age   Always       -       65535
232 Available_Reservd_Space 0x0033   100   100   010    Pre-fail  Always       -       0
233 Media_Wearout_Indicator 0x0032   100   100   000    Old_age   Always       -       0
241 Total_LBAs_Written      0x0032   100   100   000    Old_age   Always       -       17041
242 Total_LBAs_Read         0x0032   100   100   000    Old_age   Always       -       13837
249 Unknown_Attribute       0x0013   100   100   000    Pre-fail  Always       -       623

SMART Error Log not supported
SMART Self-test Log not supported
Note: selective self-test log revision number (0) not 1 implies that no selective self-test has ever been run
SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Да, диск не

Да, диск не забит...
/dev/sda1 221G 12G 198G 6% /

.

Olegon, мона спросить?
А зачем на корне -o mand, если

man 2 fsctl, секция ДЕФЕКТЫ написал(а):
Реализация обязательной блокировки во всех известных версиях Linux проводит к состязательности процессов, что делает её ненадёжной:
...

Я лично ничего против этого не имею, токмо ради интереса.

Спасибо :) Не знаю,

Спасибо :) Не знаю, исторически возникла.

вот тут

вот тут http://habrahabr.ru/post/157613/ есть метод борьбы

Дело не в том, чтобы

Дело не в том, чтобы дождаться удаления, а в том, почему машина при этом вешается. Сейчас есть подозрения на работу trim, в ближайшие выходные проверю работу без него и ежедневным запуском fstrim

Не знаю, имеет ли это

Не знаю, имеет ли это отношение к данной ситуации, но я уже много раз сталкивался с тем, что большая дисковая активность тормозит все процессы которые пытаются с диском общаться. К примеру, когда я запускаю создание файла гигабайт на 30, с обязательным обнулением, то подвисают возможности залогиниться, или запустить ls. Однако программы не обращающиеся к диску при этом работают. На сколько я понимаю, просто диск не успевает реагировать на запросы ядра, в результате все процессы подвисают со статусом D.

Чем больше юзерфрендли, тем сложнее юзать.

Это должен разруливать

Это должен разруливать планировщик ввода-вывода. Попробуйте разные, возможно "один из" даст нужный Вам результат.

Настройки просмотра комментариев

Выберите нужный метод показа комментариев и нажмите "Сохранить установки".