продавец на AliExpress продал бракованную память, а AliExpress молчит уже неделю
Был у меня сервер на 2 Xeon 2630 с 64 GB (4x16GB DDR3 1333MHz) памяти, купленный, между прочим на том же AliExpress и не нарадовался я ему, но аппетиты росли и уже требовалось не 64GB, а 128GB, так как я активно пользовался виртуализацией и разворачивал на этом сервере различные лабы. И вот решился я купить память 4x32GB ВВК3 1333MHz вот тут
Сказано, сделано — заказ № 5015059568110910 оформлен и 16.12.2021 я его получаю и ставлю в свой сервер. Радости нет предела, все стресс-тесты проходит успешно, memtest, в самом Linux (я использую CentOS 7) stress-ng тоже всё хорошо, нагружаю очередной лабой на 120GB и тоже всё замечательно. Радуюсь и работаю… Чего ещё пожелать?
Но не долго длилось моё счастье… 25.01.2022 в консоли посыпались ошибки по памяти… Сначала вот так:
Hardware event. This is not a software error.
MCE 0
CPU 6 BANK 7
MISC 2040129286 ADDR 1f1343fa80
TIME 1643102195 Tue Jan 25 12:16:35 2022
MCG status:
MCi status:
Corrected error
MCi_MISC register valid
MCi_ADDR register valid
MCA: memory controller RD_channel2_ERR
Transaction: Memory read error
status 8c00004000010092 mcgstatus 0
mcgcap 1000c17 apicid 20 socketid 1
microcode 42e
CPUID Vendor Intel Family 6 Model 62
Hardware event. This is not a software error.
MCE 1
CPU 6 BANK 7
MISC 21404aca86 ADDR 1efa2fd080
TIME 1643245096 Thu Jan 27 03:58:16 2022
MCG status:
MCi status:
Corrected error
MCi_MISC register valid
MCi_ADDR register valid
MCA: memory controller RD_channel2_ERR
Transaction: Memory read error
status 8c00004000010092 mcgstatus 0
mcgcap 1000c17 apicid 20 socketid 1
microcode 42e
CPUID Vendor Intel Family 6 Model 62
А далее и по сей день — вот так
[Sat Jan 29 18:59:50 2022] mce: [Hardware Error]: Machine check events logged
[Sat Jan 29 18:59:50 2022] EDAC sbridge MC1: handling MCE memory ERROR
[Sat Jan 29 18:59:50 2022] EDAC sbridge MC1: CPU 6: Machine Check Event: 0 Bank 11: 8c000045000800c2
[Sat Jan 29 18:59:50 2022] EDAC sbridge MC1: TSC 0
[Sat Jan 29 18:59:50 2022] EDAC sbridge MC1: ADDR a29969000
[Sat Jan 29 18:59:50 2022] EDAC sbridge MC1: MISC 908400100010a8c
[Sat Jan 29 18:59:50 2022] EDAC sbridge MC1: processor 0:306e4 TIME 1643471990 socket 1 APIC 20
[Sat Jan 29 18:59:50 2022] EDAC MC1: 1 CE memory scrubbing error on CPU_SrcID#1_Ha#0_Chan#2_DIMM#0 (channel:2 page:0xa29969 offset:0x0 grain:32 syndrome:0x0 — area:DRAM err_code:0008:00c2 socket:1 ha:0 channel_mask:4 rank:255)
Ну я, естественно, сразу к продавцу...
А в это время пошёл сам пробовать решить проблему, читать документацию и статьи в интернете. Пошёл в сам товар и понял, что все 5-и звёздочные отзывы - это такие же люди как и я, которые используют память первый месяц, пока она не деградировала или написали отзыв вообще без теста:
А смотреть надо было на вот тот процент, где плохие отзывы, именно там видно весь ужас этого товара:
Или вот так:
То есть, продавец шьет старую БУ память (перешивает SPD) и продаёт её как новую... Постойте... Новую? Или всё же старую?
Вы видите тут, что она БУ? Нет? "А суслик есть" :)
Ну ok, решил попробовать погонять память по слотам/отдельно каждую плашку - результата: ноль. Сбоят все планки, просто требуется время. Меняю обратно старую память 4x16GB и всё работает великолепно.
Пошёл по форумам и обнаружил, что уже были люди, которые также покупали подобный брак... На секундочку... Купить брак за 16 000 руб. Ну такое себе...
И все пишут о том, что можно заставить её (память) работать стабильно на более низких частотах. И вот тут меня ждал казус - материнка то не поддерживает установку частот кроме как Auto, а рисковать и шаманить с BIOS без программатора - опасное занятие - в результате заказал программатор и сейчас уже жду его.
А пока решил обратиться к AliExpress... Ну решить дело мирно. И что бы вы думали? А вот - фиг вам. Никакие доводы слушать они не хотят и просто игнорят, прошло время защиты заказа в 15 дней (с 16.12.2021 по 31.12.2021) и всё тут, а что проблема возникла с товаром за 16 000 руб. уже спустя приблизительно месяц - 25.02.2022 - знать они не хотят. Уже открыто два кейса, оба с детальным описанием проблемы и видео, когда память крашится и от этого буквально разваливается операционная система и мои данные, но их эта проблема мало калышит.
Кейс первый, открыт 12.02.2022: 2053800051271059
Кейс второй, открыт 16.02.2022: 2053800062287971
А знаете, что самое смешное... От продавца ответа не последовало даже по сей день... Ну и естественно, ни отзыв не оставишь, ни спор не откроешь:
А самое смешное, это когда я пишу на Customer Support AliExpress письмо уходит и через некоторое время приходит отлуп от почтового сервера AliExpress, что ящик абонента переполнен:
Ах, да... "Не забудьте поспешить, вам всего один день дан"
Ну и в завершении оставлю две видюшки, которые я им отсылал, в которых изображено всё безобразие, которое творится на сервере из-за этой памяти:
1) https://drive.google.com/file/d/1F5LH3jJ8WKib11Dbg_kBNciUeDEIkj-5/view?usp=sharing
2) https://www.mediafire.com/file/6xa4p3ynu5nksbi/memory_issue.mp4/file