Task 16067708

Name	hadcm3n_7xhl_1980_40_008454684_2
Workunit	8605540
Created	14 Oct 2013, 22:37:44 UTC
Sent	14 Oct 2013, 22:37:48 UTC
Report deadline	14 Jan 2014, 6:04:59 UTC
Received	9 Dec 2013, 9:48:57 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1234031
Run time	10 days 8 hours 12 min 12 sec
CPU time	9 days 16 hours 36 min 18 sec
Validate state	Invalid
Credit	6,220.80
Device peak FLOPS	2.41 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> O dispositivo não reconhece o comando. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5188, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5372, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=488, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4336, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4452, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4452, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4600, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4600, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=4600, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=5476, iMonCtr=1 Model crash detected, will try to restart... 11:28:09 (4844): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 08:40:40 (5268): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:47:03 (3492): No heartbeat from core client for 30 sec - exiting 10:47:04 (3492): No heartbeat from core client for 30 sec - exiting 10:47:05 (3492): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Model crashed: INITDUMP: Wrong no of ocean prognostic fields tmp/pipe_dummy 2048 Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
07 Dec 2013 20:13:30	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	518,400	797,178	1.5378
23 Nov 2013 16:16:27	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	492,480	756,102	1.5353
23 Nov 2013 04:26:09	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	466,560	716,201	1.5351
22 Nov 2013 16:44:32	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	440,640	676,470	1.5352
21 Nov 2013 19:51:07	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	414,720	640,236	1.5438
19 Nov 2013 21:53:31	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	388,800	599,458	1.5418
16 Nov 2013 17:34:59	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	362,880	555,724	1.5314
10 Nov 2013 09:23:03	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	336,960	515,077	1.5286
26 Oct 2013 01:49:00	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	311,040	475,565	1.5290
25 Oct 2013 14:05:30	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	285,120	435,635	1.5279
24 Oct 2013 16:54:03	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	259,200	398,341	1.5368
23 Oct 2013 19:51:14	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	233,280	356,366	1.5276
22 Oct 2013 21:16:22	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	207,360	316,863	1.5281
21 Oct 2013 21:13:12	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	181,440	277,312	1.5284
20 Oct 2013 23:04:39	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	155,520	237,720	1.5285
20 Oct 2013 11:04:04	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	129,600	198,153	1.5290
19 Oct 2013 15:30:20	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	103,680	158,458	1.5283
18 Oct 2013 20:00:29	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	77,760	122,696	1.5779
17 Oct 2013 21:20:28	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	51,840	79,875	1.5408
16 Oct 2013 17:05:31	1234031	16067708	hadcm3n_7xhl_1980_40_008454684_2	25,920	40,228	1.5520