Task 13021987

Name	hadcm3n_t2f0_1940_40_007314658_0
Workunit	7512088
Created	28 Jun 2011, 17:09:11 UTC
Sent	28 Jun 2011, 17:10:50 UTC
Report deadline	28 Sep 2011, 0:38:01 UTC
Received	15 Aug 2011, 8:36:14 UTC
Server state	Over
Outcome	Computation error
Client state	Compute error
Exit status	-177 (0xFFFFFF4F) ERR_RSC_LIMIT_EXCEEDED
Computer ID	1154579
Run time	23 days 6 hours 14 min 58 sec
CPU time	21 days 20 hours 57 min 42 sec
Validate state	Invalid
Credit	11,819.52
Device peak FLOPS	2.25 GFLOPS
Application version	UK Met Office Coupled Model Full Resolution Ocean v6.07 windows_intelx86
Stderr	<core_client_version>6.12.33</core_client_version> <![CDATA[ <message> Maximum memory exceeded </message> <stderr_txt> Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 14:49:58 (5560): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:09:54 (6868): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:09:55 (6868): No heartbeat from core client for 30 sec - exiting 15:09:56 (6868): No heartbeat from core client for 30 sec - exiting 15:28:23 (5948): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:37:56 (7712): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:59:47 (4256): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 15:59:48 (4256): No heartbeat from core client for 30 sec - exiting 15:59:49 (4256): No heartbeat from core client for 30 sec - exiting 15:59:50 (4256): No heartbeat from core client for 30 sec - exiting 15:59:51 (4256): No heartbeat from core client for 30 sec - exiting 15:59:52 (4256): No heartbeat from core client for 30 sec - exiting 15:59:53 (4256): No heartbeat from core client for 30 sec - exiting 15:59:54 (4256): No heartbeat from core client for 30 sec - exiting Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3956, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3956, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3956, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3956, iMonCtr=1 Model crash detected, will try to restart... Controller:: CPDN process is not running, exiting, bRetVal = 1, checkPID=0, selfPID=3956, iMonCtr=1 Model crash detected, will try to restart... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... 13:33:27 (4380): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... CPDN Monitor - Quit request from BOINC... 23:16:49 (5568): No heartbeat from core client for 30 sec - exiting 23:16:50 (5568): No heartbeat from core client for 30 sec - exiting 23:16:51 (5568): No heartbeat from core client for 30 sec - exiting 23:16:52 (5568): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... Suspended CPDN Monitor - Suspend request from BOINC... 10:52:41 (1120): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... 10:56:11 (1204): Can't acquire lockfile (32) - waiting 35s 10:56:46 (1204): Can't acquire lockfile (32) - exiting 10:56:46 (1204): Error: Det går inte att komma åt filen eftersom den används av en annan process. (0x20) CPDN Monitor - Quit request from BOINC... CPDN Monitor - Quit request from BOINC... No Process Handle Worker:: CPDN process is not running, exiting, bRetVal = 1, checkPID=5652, selfPID=5652, iMonCtr=1 BUFFIN: C I/O Error feof - Unit 69 - Return code = 16 Error converting file to netcdf: dataout/t2f0ko.pjh8c10 09:13:23 (6124): No heartbeat from core client for 30 sec - exiting CPDN Monitor - No 'heartbeat' from BOINC... CPDN Monitor - Quit request from BOINC... CPDN Monitor - Abort request from BOINC... Called boinc_finish </stderr_txt> ]]>

Latest Trickles Received
Time Sent (UTC)	Host ID	Result ID	Result Name	Timestep	CPU Time (sec)	Average (sec/TS)
15 Aug 2011 07:13:56	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	984,960	1,889,898	1.9188
10 Aug 2011 11:05:15	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	959,040	1,844,909	1.9237
08 Aug 2011 10:10:34	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	933,120	1,798,651	1.9276
07 Aug 2011 20:56:39	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	907,200	1,753,404	1.9328
07 Aug 2011 07:30:31	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	881,280	1,709,078	1.9393
05 Aug 2011 04:12:12	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	855,360	1,666,119	1.9479
03 Aug 2011 22:06:09	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	829,440	1,624,413	1.9584
01 Aug 2011 05:09:15	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	777,600	1,540,556	1.9812
25 Jul 2011 17:16:41	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	751,680	1,495,270	1.9892
25 Jul 2011 16:20:44	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	725,760	1,443,192	1.9885
25 Jul 2011 15:52:54	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	699,840	1,390,862	1.9874
25 Jul 2011 15:31:01	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	673,920	1,338,611	1.9863
25 Jul 2011 14:42:05	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	648,000	1,286,758	1.9857
25 Jul 2011 12:59:57	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	622,080	1,234,700	1.9848
25 Jul 2011 12:59:57	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	596,160	1,184,338	1.9866
25 Jul 2011 12:59:57	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	570,240	1,132,110	1.9853
25 Jul 2011 12:59:56	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	544,320	1,077,408	1.9794
25 Jul 2011 12:59:56	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	518,400	1,023,711	1.9748
25 Jul 2011 12:59:56	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	492,480	970,197	1.9700
10 Jul 2011 17:47:50	1154579	13021987	hadcm3n_t2f0_1940_40_007314658_0	466,560	915,766	1.9628