Task 15902916

Name	hadcm3n_n1gr_1920_40_008403357_0
Workunit	8554213
Created	23 Jul 2013, 11:39:05 UTC
Sent	23 Jul 2013, 11:44:30 UTC
Report deadline	22 Oct 2013, 19:11:41 UTC
Received	21 Aug 2013, 13:43:48 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	22 (0x00000016) Unknown error code
Computer ID	1282948
Run time	21 days 17 hours 58 min 7 sec
CPU time	18 days 21 hours 32 min 2 sec
Validate state	Invalid
Credit	11,508.48
Device peak FLOPS	2.59 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>7.0.64</core_client_version> <![CDATA[ <message> The device does not recognize the command. (0x16) - exit code 22 (0x16) </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 14:08:27 (12140): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1356, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1356, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1356, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1356, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1356, iMonCtr=1 Model crash detected, will try to restart... Signal 22 received, exiting... Called boinc_finish Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=1356, iMonCtr=1 Model crash detected, will try to restart... Sorry, too many model crashes! :-( Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
20 Aug 2013 16:55:36	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	959,040	1,610,436	1.6792
19 Aug 2013 22:44:10	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	933,120	1,566,946	1.6793
19 Aug 2013 07:44:32	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	907,200	1,522,094	1.6778
18 Aug 2013 17:56:34	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	881,280	1,478,284	1.6774
14 Aug 2013 16:19:57	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	855,360	1,434,917	1.6776
14 Aug 2013 16:19:57	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	829,440	1,388,512	1.6740
14 Aug 2013 16:19:57	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	803,520	1,342,838	1.6712
14 Aug 2013 16:19:57	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	777,600	1,298,850	1.6703
14 Aug 2013 16:19:57	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	751,680	1,255,302	1.6700
14 Aug 2013 16:19:57	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	725,760	1,211,689	1.6695
14 Aug 2013 16:19:57	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	699,840	1,167,486	1.6682
14 Aug 2013 16:19:57	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	673,920	1,123,180	1.6666
14 Aug 2013 16:19:56	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	648,000	1,078,945	1.6650
14 Aug 2013 16:19:56	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	622,080	1,035,498	1.6646
14 Aug 2013 16:19:56	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	596,160	991,767	1.6636
14 Aug 2013 16:19:56	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	570,240	948,178	1.6628
14 Aug 2013 16:19:56	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	544,320	904,103	1.6610
14 Aug 2013 16:19:56	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	518,400	860,149	1.6592
14 Aug 2013 16:19:56	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	492,480	819,636	1.6643
14 Aug 2013 16:19:56	1282948	15902916	hadcm3n_n1gr_1920_40_008403357_0	466,560	776,335	1.6640