Mga teknikal na pagtutukoy ng Amd radeon hd 6900 series. Bago sa AMD Cayman: mula VLIW5 hanggang VLIW4

AMD Radeon HD 6950/6970:

paglalarawan ng mga video card at mga resulta ng mga synthetic na pagsubok

Makatuwirang ipaalala sa iyo muli na ang mga card ay nangangailangan ng karagdagang kapangyarihan, at ang 6950 ay nangangailangan ng dalawang 6-pin na konektor. At 6970 - 8-pin at 6-pin. Umaasa kami na isasama ng mga kasosyo ng AMD ang naaangkop na mga adaptor ng power splitter sa kit.

Tungkol sa sistema ng paglamig.

AMD Radeon HD 6950/6970 2048 MB 256-bit GDDR5, PCI-E

Kapansin-pansin na ang CO ay halos kapareho sa prinsipyo sa kung ano ang nakita natin sa GTX 580/570, at nakabatay din ito sa isang silid ng singaw, na nakapaloob sa isang makitid na kompartimento ng tanso na nakikipag-ugnayan sa GPU. Sa itaas ng silid na ito mayroong isang istraktura ng mga cooling fins kung saan dumadaan ang hangin, na hinimok ng isang cylindrical fan sa dulo ng buong aparato. Totoo, hindi katulad ng GTX 580, sa kasong ito ang buong istraktura ay gawa sa tanso, kabilang ang mga radiator fins, kaya ang CO ay naging napakabigat.

Naisulat na namin na ang gayong solusyon ay mas epektibo kaysa sa tradisyonal na ginamit dati sa mga heat pipe. Sa loob ng evaporation chamber mayroong isang espesyal na likido na agad na naglilipat ng init mula sa ilalim na plato hanggang sa itaas.

Ito rin ay lalo na nagkakahalaga ng pagpuna na ang CO ay isinaayos para sa mga menor de edad na reaksyon kapag nagpainit upang matiyak ang halos tahimik na operasyon. Samakatuwid, ang core heating ay maaaring lumampas pa sa nakita natin sa kaso ng 5870.

Nagsagawa kami ng pag-aaral ng temperatura gamit ang MSI Afterburner utility (may-akda A. Nikolaychuk AKA Unwinder) at nakuha ang mga sumusunod na resulta:

AMD Radeon HD 6970 2048 MB 256-bit GDDR5, PCI-E

AMD Radeon HD 6950 2048 MB 256-bit GDDR5, PCI-E

Ang mga resulta ng pag-aaral ay nagpakita na, sa kabila ng lahat ng nasa itaas, ang CO ay talagang epektibo, at kahit na sa bilis ng pag-ikot ng 40% ng maximum, ang pag-init ay 92 degrees para sa 6970, at 84 para sa 6950. Ito ay pagkatapos 6 na oras ng patuloy na pagsubok sa ilalim ng pagkarga sa 3D. Oo, ang 92 degrees ay maaaring mukhang labis na mataas sa ilan, ngunit para sa mga Hi-End accelerators ito ay katanggap-tanggap.

Ang maximum na pagkonsumo ng kuryente ng mga card sa ilalim ng pagkarga ay 250-260 W para sa 6970 at bahagyang mas mataas kaysa sa 205 W para sa 6950. Sinadya naming hindi nagbibigay ng anumang mga graph ng pagkonsumo upang hindi kumplikado ang pagbabasa ng materyal. Ang mga mambabasa ay palaging interesado sa kung magkano ang natupok nito sa maximum upang piliin ang tamang supply ng kuryente, ngunit kakaunti ang mga tao na interesado sa mga detalye.

Kagamitan. Isinasaalang-alang na ang mga reference na sample ay walang kumpletong hanay, aalisin namin ang tanong na ito.

Pag-install at mga driver

Configuration ng test bench:

  • Computer batay sa CPU Intel Core i7-975 (Socket 1366)
    • Intel Core i7-975 processor (3340 MHz);
    • Asus P6T Deluxe motherboard batay sa Intel X58 chipset;
    • RAM 6 GB DDR3 SDRAM Corsair 1600 MHz;
    • hard drive WD Caviar SE WD1600JD 160 GB SATA;
    • supply ng kuryente Tagan TG900-BZ 900 W.
  • operating system na Windows 7 64-bit; DirectX 11;
  • Dell 3007WFP monitor (30″);
  • bersyon ng mga driver ng ATI Catalyst 10.11; Nvidia bersyon 263.09 / 260.99.

Naka-disable ang VSync.

Mga sintetikong pagsubok

Ang mga synthetic test package na ginagamit namin ay maaaring i-download dito:

  • D3D RightMark Beta 4 (1050) na may paglalarawan sa website na 3d.rightmark.org.
  • D3D RightMark Pixel Shading 2 at D3D RightMark Pixel Shading 3— mga pagsubok ng mga pixel shader na bersyon 2.0 at 3.0, link.
  • RightMark3D 2.0 na may maikling paglalarawan: para sa Vista na walang SP1, para sa Vista na may SP1.

Sa kawalan ng aming sariling mga synthetic na DirectX 11 na pagsubok, muli kaming gumamit ng mga halimbawa mula sa Microsoft at AMD SDK at ang Nvidia demo program. Una, mayroong HDRToneMappingCS11.exe at NBodyGravityCS11.exe mula sa DirectX SDK (Pebrero 2010).

Kumuha din kami ng mga application mula sa parehong mga tagagawa: Nvidia at AMD. Ang mga halimbawa ng DetailTessellation11 at PNTriangles11 ay kinuha mula sa ATI Radeon SDK (nasa DirectX SDK din sila). Bukod pa rito, gumamit kami ng demo program mula sa Nvidia - Realistic Water Terrain, na kilala rin bilang Island11 (may-akda - Timofey Cheblokov, isang napaka sikat na espesyalista sa 3D graphics).

Ang mga sintetikong pagsusuri ay isinagawa sa mga sumusunod na video card:

  • Radeon HD 6970 HD 6970)
  • Radeon HD 6950 na may mga karaniwang parameter (karagdagang HD 6950)
  • Radeon HD 6870 na may mga karaniwang parameter (karagdagang HD 6870)
  • Radeon HD 5870 na may mga karaniwang parameter (karagdagang HD 5870)
  • GeForce GTX 580 na may mga karaniwang parameter (karagdagang GTX 580)
  • GeForce GTX 570 na may mga karaniwang parameter (karagdagang GTX 570)

Upang ihambing ang mga resulta ng mga bagong modelo ng Radeon HD 6900 series na video card, pinili ang mga modelong ito dahil ang Radeon HD 5870 ay ang dating single-chip solution ng kumpanya para sa pinakamataas na hanay ng presyo, ang pinakamalakas bago ang paglabas ng mga bagong modelo; Ang Radeon HD 6870 ay ang kasalukuyang solusyon ng AMD, isang hakbang sa ibaba ng mga nangungunang at batay sa kamakailang inilabas na Barts video chip.

Ibig sabihin, ang mga solusyon sa Nvidia na ito ay kinuha dahil ang Geforce GTX 580 ay ang pinakamabilis na modelo ng single-chip ng kumpanya, batay sa isang sariwang GPU. Bagaman hindi ito isang katunggali sa ipinakita na mga video card sa mga tuntunin ng presyo, ang mga resulta nito ay kawili-wili bilang isang uri ng maximum na bar para sa mga solusyon sa Nvidia. Well, ang GTX 570 ay kinuha bilang isang direktang katunggali sa mas lumang modelo ng bagong serye - HD 6970.

Direct3D 9: Mga pagsubok sa Pixel Filling

Tinutukoy ng pagsubok na ito ang peak texture sampling performance (texel rate) sa FFP mode para sa iba't ibang bilang ng mga texture na inilapat sa isang pixel:

SA pagsubok na ito pag-filter ng 32-bit (8 bits bawat kulay) na mga texture, karamihan sa mga video card ay nagpapakita ng mga numero na malayo sa teoryang posible. Kaya't ang mga resulta ng aming mga texture synthetic sa kaso ng mga HD 6900 series na video card ay hindi umabot sa mga peak value. Susunod, titingnan natin muli ang bilis ng pag-text, sa isang pagsubok mula sa pakete ng 3DMark Vantage, kung saan makakakuha tayo ng mas makatotohanang mga numero.

At dito lumalabas na ang HD 6970 ay pumipili lamang ng 67 texel bawat cycle ng orasan mula sa 32-bit na mga texture sa panahon ng pag-filter ng bilinear, na halos isang ikatlong mas mababa kaysa sa theoretical figure ng 96 na na-filter na mga texel. Para sa HD 6950, ang mga figure na ito ay tumutugma sa 62 texels sa 88 na teoretikal, iyon ay, ang kahusayan ng mas batang modelo ay naging bahagyang mas mataas, at ito ay dahil sa bahagyang pagkakaiba sa bandwidth memorya ng video, na nakakaapekto rin sa mga resulta.

Hindi nakakagulat na ang lahat ng mga AMD card ay nagpapakita ng napakataas na pagganap at higit na nangunguna sa kanilang mga karibal mula sa Nvidia. Pagkatapos ng lahat, ang kanilang teoretikal na bilis ng texturing ay napakataas. Ngunit kahit na ang top-end na GTX 580 ay mayroon lamang 64 TMU at mas mababa sa mga modelo sa Cayman, na mayroong 88-96 TMU, at kahit na gumagana sa mas mataas na frequency.

Ang pagkakaiba sa pagitan ng HD 6950 at HD 5870 ay naging napaka-interesante iba't ibang kondisyon. Kung sa mga kaso na may malaking halaga mga texture, kung saan ang bilang ng mga TMU at ang kanilang dalas ay may pinakamalaking epekto, ang mga ito ay pare-pareho, pagkatapos ay may mas kaunting mga texture sa bawat pixel, ang HD 5870 na modelo ay nauuna. Bukod dito, ang pagkakaiba ay hindi maaaring maiugnay lamang sa bandwidth ng memorya, at marahil ang iba't ibang mga pag-optimize sa mga driver ay mayroon ding epekto dito.

Tingnan natin ang parehong mga resulta sa pagsubok sa rate ng pagpuno:

Ipinapakita ng mga numerong ito ang rate ng pagpuno, at sa mga ito ay nakikita namin ang lahat ng pareho, maliban na isinasaalang-alang namin ang bilang ng mga pixel na nakasulat sa frame buffer. Ang pinakamataas na resulta ay nananatili sa mga bagong nangungunang solusyon ng Radeon HD 6900 na pamilya, na mayroon lamang malaking bilang ng mga TMU at mas mahusay sa aming synthetic na pagsubok. Nakapagtataka, sa mga kaso na may 0-4 na naka-overlay na mga texture, ang pinakabata sa mga video card na isinasaalang-alang natin ngayon ay sa ilang kadahilanan ay mas mababa kaysa sa nakaraang top-end na solusyon sa AMD, bagaman sa mahirap na kondisyon halos nakikisabay sa kanya.

Direct3D 9: Mga pagsubok sa Pixel Shaders

Ang unang pangkat ng mga pixel shader na aming isinasaalang-alang ay napakasimple para sa mga modernong video chips, kabilang dito ang iba't ibang bersyon ng mga pixel program na medyo mababa ang pagiging kumplikado: 1.1, 1.4 at 2.0, na matatagpuan sa mga mas lumang laro.

Ang mga pagsubok ay napaka-simple para sa mga modernong GPU at lubos na nakatuon sa pagganap ng texturing. Samakatuwid, hindi nila ipinapakita ang lahat ng mga kakayahan ng mga modernong video chips, ngunit kawili-wili pa rin ang mga ito para sa pagtatasa ng balanse sa pagitan ng mga sample ng texture at mga kalkulasyon sa matematika. Sa kasong ito, walang mga espesyal na pagkakaiba sa pagitan ng HD 5870 at HD 6950; ang mga resulta ng mga modelong ito ay maihahambing. Bagaman ang isang pagsubok ay nakatayo - ang pixel shader ng pag-iilaw na may tatlong pinagmumulan ayon kay Phong ay malinaw na nakasalalay sa pagganap ng matematika ng GPU, at samakatuwid tanging ang mas lumang modelo, ang HD 6970, ang umabot sa antas ng HD 5870 dito.

Ang pagganap sa iba pang mga pagsubok ay kadalasang limitado sa pamamagitan ng bilis ng unit ng texture at rate ng pagpuno, ngunit isinasaalang-alang ang kahusayan ng block at pag-cache ng data. Ang mga bagong modelo ng serye ng Radeon HD 6900 ay bahagyang mas mabilis kaysa sa kanilang mga nauna: ang HD 6970 ay mas mabilis kaysa sa HD 5870, at ang HD 6950 ay mas mabilis kaysa sa HD 6870 (mula sa ibang hanay ng presyo). At halos lahat ng mga ito ay nauuna sa parehong nangungunang mga modelo ng GeForce - kahit na ang GTX 580 sa mga pagsubok na ito ay nagpapakita ng mga resulta lamang sa antas ng HD 6870, at ang kakulangan ng bilis ng texturing ay malinaw na sinisisi para dito.

Tingnan natin ang mga resulta ng mas kumplikadong mga intermediate pixel program:

At sa pagkakataong ito nangyari ito nang halos pareho, muli ang GTX 580 ay mas nakikipagkumpitensya sa HD 6870 kaysa sa mga tunay na nangungunang modelo ng AMD. Ang pagsusulit sa Cook-Torrance ay mas masinsinang computation, at ang pagkakaiba dito ay halos tumutugma sa pagkakaiba sa bilang ng mga ALU at ang kanilang dalas. Iyon ang dahilan kung bakit ang pagsubok na ito ay mas angkop para sa arkitektura ng AMD, na ang mga chip ay may mas malaking bilang ng mga yunit ng matematika.

At dito natagpuan ang dalawang kawili-wiling punto. Una, ang HD 5870 ay higit na gumaganap kahit na ang HD 6970, na mahirap ipaliwanag sa pamamagitan lamang ng mga teoretikal na katangian. Halos walang pagkakaiba sa pinakamataas na pagganap sa matematika sa pagitan ng mga modelong ito, ngunit mayroon ding mga pagkakaiba sa arkitektura. Tila ang iba't ibang kahusayan ng pagpapatupad ng shader na ito sa parehong mga processor ng VLIW5 at VLIW4 ang humantong sa gayong pagkakaiba na hindi pabor sa bagong Cayman chip. Samakatuwid, ang HD 6950 sa pagsubok na ito ay gumanap lamang sa antas ng HD 6870, pati na rin ang GTX 580.

Ang pangalawang pagsubok ng procedural water visualization, "Water," na lubos na nakadepende sa bilis ng pag-text, ay gumagamit ng isang nakadependeng sample mula sa mga texture ng malalaking antas ng nesting, at ang mga video card sa loob nito ay niraranggo ayon sa bilis ng pag-text, na inayos para sa iba't ibang bisa gamit ang TMU.

Sa pagsubok na ito, mahusay ang mga bagong solusyon, ang HD 6950 ay nagbibigay ng mga resulta sa antas ng HD 5870, at ang HD 6970 ay humahantong na may magandang margin, halos katumbas ng 25 porsiyentong pagkakaiba sa teoretikal na bilis ng texturing. Malinaw na ang mga video card ng Nvidia ay walang makukuha dito, at nagpapakita sila ng mga resulta sa antas ng isang kapansin-pansing mas murang modelo ng kakumpitensya.

Direct3D 9: sinusubok ng pixel shader ang Pixel Shaders 2.0

Ang mga pagsubok na ito ng DirectX 9 pixel shader ay mas kumplikado kaysa sa mga nauna, ang mga ito ay malapit sa nakikita natin ngayon sa mga multi-platform na laro, at nahahati sa dalawang kategorya. Magsimula tayo sa mas simpleng bersyon 2.0 shaders:

  • Parallax Mapping- isang paraan ng texture mapping na pamilyar sa karamihan sa mga modernong laro, na inilarawan nang detalyado sa artikulo.
  • Naka-frozen na Salamin- isang kumplikadong texture ng pamamaraan ng frozen na salamin na may nakokontrol na mga parameter.

Mayroong dalawang variant ng mga shader na ito: ang mga nakatuon sa mga kalkulasyon sa matematika at ang mga may kagustuhan para sa mga halaga ng sampling mula sa mga texture. Isaalang-alang natin ang mathematically intensive na mga opsyon na mas promising mula sa punto ng view ng mga application sa hinaharap:

Ito ay mga unibersal na pagsubok na nakasalalay sa parehong bilis ng mga yunit ng ALU at ang bilis ng pag-text; ang kabuuang balanse ng chip ay mahalaga sa kanila. Ang pagganap ng mga bagong AMD graphics card sa Frozen Glass test ay medyo mahusay, ang HD 6970 ay muling kapansin-pansing mas mabilis kaysa sa HD 5870, at ang HD 6950 ay halos nahuli. Sa kasamaang palad para sa Nvidia, dahil sa mahinang pag-text, ang mga solusyon ng AMD ay muling kapansin-pansing mas mabilis.

Sa pangalawang pagsubok na "Parallax Mapping", mas maganda na ang pakiramdam ng mga solusyon ng Nvidia, at ang HD 6870 at HD 6950 ay malapit sa mga resulta ng GTX 580 card mula sa isa pang segment ng merkado, na mas mahal. Kapansin-pansin, ang HD 5870 ay muling naging mas mabilis kaysa sa HD 6970. Kinukumpirma nito ang aming teorya na ang bilis sa pagsusulit ay nalilimitahan ng pagganap sa matematika at ang pagsubok ay bahagyang hindi angkop para sa bagong arkitektura ng AMD.

May isa pang malamang na paliwanag - ang mga sintetikong pagsusulit ay kadalasang naglo-load nang husto sa GPU ng magkatulad na mga kalkulasyon, at ang pagkonsumo ng kuryente ng mga bagong modelo sa synthetics ay maaaring lumampas sa itinakdang limitasyon. Dahil dito, ang dalas ng orasan ay maaari ding bumaba, at kasama nito ang mga resulta ay maaaring mas mababa kaysa sa inaasahan. Gayunpaman, ang pagpapalagay na ito ay kailangang suriin. Isaalang-alang natin ang parehong mga pagsubok na ito sa isang pagbabago na may kagustuhan para sa mga sample mula sa mga texture kaysa sa mga kalkulasyon sa matematika:

Para sa mga solusyon sa Nvidia, ang sitwasyon ay naging kapansin-pansing mas malungkot, dahil ang bilis ng pag-text ng pinakabagong AMD chips, hindi katulad ng kanilang mga kakumpitensya, ay napakahusay, kaya pinapataas lamang nila ang kanilang hindi maikakaila na kalamangan. Kahit na ang pinakamahusay na GTX 580 ay mas mababa sa parehong HD 6870 sa parehong mga pagsubok na may diin sa texturing. Buweno, ang aming mga bagong bayani mula sa pamilyang HD 6900 ay naging pinakamabilis, tinalo pa ng HD 6950 ang HD 5870, kahit na mga piso lamang. At ang HD 6970 ay muling naging pinuno, na mauunawaan sa teorya kung titingnan mo ang pagganap ng mga yunit ng TMU.

Ang mga ito ay pawang mga legacy na gawain, karamihan ay may diin sa texturing, at mas madalas sa fillrate. Susunod, titingnan natin ang mga resulta ng dalawa pang pixel shader test - ngunit sa pagkakataong ito ay bersyon 3.0, ang pinakakumplikado sa aming mga pixel shader test para sa Direct3D 9 API. Ang mga ito ay pinaka-nagpahiwatig mula sa punto ng view ng mga modernong laro sa PC, marami sa mga ito ay multi-platform. Naiiba ang mga pagsubok dahil mabigat nilang nilo-load ang parehong ALU at texture module; ang parehong shader program ay kumplikado at mahaba, at may kasamang malaking bilang ng mga sangay:

  • Matarik Parallax Mapping- isang mas "mabigat" na uri ng parallax mapping technique, na inilarawan din sa artikulong Modernong terminolohiya ng 3D graphics.
  • balahibo— isang procedural shader na nagbibigay ng balahibo.

Sa aming pinaka-mapanghamong mga pagsubok sa DX9, ang mga graphics card ng Nvidia ay palaging gumaganap nang mas mahusay kaysa sa mga solusyon sa AMD, salungat sa lahat ng nakaraang pagsubok. Ang sitwasyong ito ay dahil sa katotohanan na ang mga pagsubok na ito ay hindi limitado sa pagganap ng mga sample ng texture, ngunit sa halip ay nakasalalay sa kahusayan ng pagpapatupad ng pixel shader code.

Sa mga pagsubok ng mga kumplikadong pixel shaders na bersyon 3.0, ang bagong nangungunang AMD video card ay hindi pa rin makahabol sa kanilang mga kakumpitensya, bagama't sila ay kapansin-pansing mas malapit sa kanila. Ang bilis sa parehong mga pagsubok sa PS 3.0 ay bahagyang nakadepende sa memory bandwidth at texturing, ngunit ang code ay kumplikado, kung saan ang bagong arkitektura ng Nvidia at... ang bagong arkitektura ng AMD ay napakahusay na pinangangasiwaan. Marahil ito ang unang pagsubok kung saan nakikita natin ang isang kapansin-pansing positibong pagkakaiba sa pagitan ng nakaraan at pinakabagong mga arkitektura ng AMD.

At ang huli ay nakayanan ang gawain na malinaw na mas mahusay. Bagama't kahit na ang HD 6970 ay halos hindi makipagkumpitensya sa GTX 570, hindi namin kailanman naisip ang tungkol dito. Ang mga solusyon sa Nvidia ay palaging hindi mapag-aalinlanganan na mga pinuno sa pares ng mga gawaing pagsubok na ito, at tradisyonal na nagpakita ng mas malakas na mga resulta. At ang mga video card na nakabatay sa bagong Cayman graphics chip ay nakalapit sa kanila.

Direct3D 10: PS 4.0 pixel shader tests (texturing, loops)

Kasama sa pangalawang bersyon ng RightMark3D ang dalawang pamilyar na PS 3.0 na pagsusulit para sa Direct3D 9, na muling isinulat para sa DirectX 10, pati na rin ang dalawa pang bagong pagsubok. Ang unang pares ay nagdagdag ng kakayahang paganahin ang self-shadowing at shader supersampling, na higit na nagpapataas ng load sa mga video chips.

Sinusukat ng mga pagsubok na ito ang performance ng mga pixel shader na tumatakbo sa mga cycle na may malaking bilang ng mga sample ng texture (sa pinakamabigat na mode, hanggang ilang daang sample bawat pixel) at medyo maliit na ALU load. Sa madaling salita, sinusukat nila ang bilis ng mga sample ng texture at ang kahusayan ng mga sanga sa pixel shader.

Ang unang pagsubok ng mga pixel shader ay Fur. Sa pinakamababang setting, gumagamit ito ng 15 hanggang 30 sample ng texture mula sa height map at dalawang sample mula sa pangunahing texture. Ang Effect detail mode - "High" ay nagdaragdag ng bilang ng mga sample sa 40-80, ang pagsasama ng "shader" supersampling - hanggang 60-120 samples, at ang "High" mode kasama ang SSAA ay nailalarawan ng maximum na "heviness" - mula 160 hanggang 320 na mga sample mula sa mapa ng taas.

Suriin muna natin ang mga mode nang hindi naka-enable ang supersampling; ang mga ito ay medyo simple, at ang ratio ng mga resulta sa "Mababa" at "Mataas" na mga mode ay dapat na halos pareho.

Ang pagganap sa pagsusulit na ito ay nakasalalay sa bilang at kahusayan ng mga TMU, ngunit nag-iiba-iba sa iba't ibang kundisyon. Ang mga resulta sa "Mataas" na antas ng detalye ay humigit-kumulang isa at kalahating beses na mas mababa kaysa sa "Mababa" na antas, gaya ng nararapat ayon sa teorya. Sa mga pagsubok sa D3D10 ng procedural fur visualization na may malaking bilang ng mga sample ng texture, ang mga solusyon sa Nvidia ay dating kapansin-pansing mas malakas, ngunit ang pinakabagong mga solusyon sa AMD ay nahuli sa kanila, na nakita na natin noon.

Sa opsyon na hindi supersampling, ang epektibong fill rate (pagganap ng ROP) at bandwidth ng memorya ay may mas malaking epekto sa pagganap. Samakatuwid, ang mga solusyon ng Nvidia ay nasa unahan, at tanging ang top-end na Radeon HD 6970, na ipinakita ngayon, ay halos nakakahabol sa junior GTX 570. Ang isang mas mababang antas na modelo na tinatawag na HD 6950 ay nagpapakita ng mga resulta sa antas ng HD 5870, ngunit ang HD 6870 nakamit ang humigit-kumulang kaparehong resulta. Hindi ito nakakagulat, dahil ang rate ng pagpuno nito ay mas mataas pa kaysa sa mas lumang mga solusyon ng seryeng HD 6900.

Tingnan natin ang resulta ng parehong pagsubok, ngunit pinagana ang supersampling ng shader, na nagpapataas ng trabaho ng apat na beses: marahil sa sitwasyong ito ay may magbabago, at ang bandwidth ng memorya na may rate ng pagpuno ay magkakaroon ng mas kaunting epekto:

Gaya ng dati, ang pagpapagana ng supersampling ay nagpapataas ng teoretikal na pagkarga ng apat na beses, at ang mga resulta ng mga solusyon sa Nvidia ay kapansin-pansing bumababa kumpara sa mga AMD video card. Ngayon ang tatlong modelo na may katulad na mga resulta (HD 6870, HD 5870 at HD 6950) ay nauuna sa GTX 570, at ang mas lumang solusyon na HD 6970 ay matagumpay na nakikipagkumpitensya sa GTX 580. Ang pagkakaiba sa pagitan ng mga nangungunang card ng HD 6000 at HD 5000 ang mga linya ay nananatiling halos pareho, ang bagong modelo ay nanalo ng ilang porsyento mula sa nauna.

Ang pangalawang DX10 shader test ay sumusukat sa pagganap ng mga kumplikadong pixel shader na may mga loop na may malaking bilang ng mga sample ng texture at tinatawag na Steep Parallax Mapping. Sa mababang mga setting, gumagamit ito ng 10 hanggang 50 sample ng texture mula sa taas na mapa at tatlong sample mula sa mga pangunahing texture. Ang pag-enable ng heavy mode na may self-shadowing ay nagdodoble sa bilang ng mga sample, at ang supersampling ay nagpapa-quadruple sa numerong ito. Ang pinaka-kumplikadong test mode na may supersampling at self-shadowing ay pumipili mula 80 hanggang 400 na mga texture value, iyon ay, walong beses na higit pa kaysa sa simpleng mode. Suriin muna natin ang mga simpleng opsyon nang walang supersampling:

Ang pangalawang Direct3D 10 pixel shader test ay medyo mas kawili-wili mula sa praktikal na pananaw, dahil ang mga uri ng parallax mapping ay malawakang ginagamit sa mga laro, at ang mga mabibigat na opsyon tulad ng aming matarik na parallax mapping ay ginagamit sa maraming proyekto, halimbawa sa mga larong Crysis at Nawawalang planeta. Bilang karagdagan, sa aming pagsubok, bilang karagdagan sa supersampling, maaari mong paganahin ang self-shadowing, na humigit-kumulang na doble ang pagkarga sa video chip; ang mode na ito ay tinatawag na "Mataas".

Ang diagram ay sa maraming paraan na katulad ng nauna (walang SSAA), ang posisyon lamang ng Nvidia ay medyo humina. Sa na-update na bersyon ng D3D10 ng pagsubok nang walang supersampling, ang HD 6970 ay nagiging kapantay ng GTX 570, na normal para sa mga direktang kakumpitensya, at ang nangungunang GTX 580 ay nananatiling nangunguna. Ang iba pang tatlong video card mula sa AMD ay nagpapakita ng magkatulad na mga resulta at lag sa likod. Tingnan natin kung ano ang pagkakaiba ng pagpapagana ng supersampling; maaari itong magdulot ng makabuluhang pagbaba sa bilis sa mga Nvidia board.

Kapag pinagana ang supersampling at self-shadowing, nagiging mas mahirap ang gawain; ang pag-enable sa parehong mga opsyon nang magkasama ay nagpapataas ng load sa mga card ng halos walong beses, na nagdudulot ng malaking pagbaba sa performance. Ang pagkakaiba sa pagitan ng mga tagapagpahiwatig ng bilis ng nasubok na mga video card ay nagbago, ang pagsasama ng supersampling ay may epekto, tulad ng sa nakaraang kaso - ang mga AMD card ay bahagyang napabuti ang kanilang pagganap kumpara sa mga solusyon sa Nvidia.

Ngayon ang HD 6970 ay nagpapakita ng mga resulta sa antas ng GTX 580, at ang HD 6950 at HD 5870, na humigit-kumulang pantay sa bilis, ay nasa parehong antas ng GTX 570. At tanging ang mas murang HD 6870 ay bahagyang nasa likod ng Nvidia na ito. video card. Ang mga paghahambing na numero para sa mga pares ng HD 6970 at HD 5870 ay naulit muli, ang pagkakaiba sa pabor sa mga pinakabagong modelo ay halos pareho. Batay sa mga pagsubok na ito, maaari nating tapusin na ang parehong mga card ng pamilyang HD 6900 na inilabas ngayon ay nakayanan ang mga gawain ng shader nang napakahusay, sa antas ng tradisyonal na malalakas na kakumpitensya ng Nvidia sa mga gawaing ito.

Direct3D 10: PS 4.0 Pixel Shader Tests (Compute)

Ang susunod na pares ng mga pixel shader test ay naglalaman ng pinakamababang bilang ng mga texture fetch para bawasan ang epekto ng performance ng mga unit ng TMU. Gumagamit sila ng isang malaking bilang ng mga pagpapatakbo ng aritmetika, at tiyak na sinusukat nila ang pagganap ng matematika ng mga video chip, ang bilis ng pagpapatupad ng mga tagubilin sa aritmetika sa isang pixel shader.

Ang unang pagsusulit sa matematika ay Mineral. Isa itong kumplikadong procedural texturing test na gumagamit lamang ng dalawang sample ng texture data at 65 sin at cos na mga tagubilin.

Ang mga resulta ng matinding mga pagsusulit sa matematika ay karaniwang tumutugma sa pagkakaiba sa mga frequency at bilang ng mga yunit ng pagpapatupad, ngunit may impluwensya ng kanilang kahusayan. Ang modernong arkitektura ng AMD ay may malaking kalamangan sa mga nakikipagkumpitensyang Nvidia graphics card sa ganitong mga kaso, at ipinapaliwanag nito ang mga resulta ng pagsubok, kung saan ang mga solusyon sa AMD ay malinaw na nagiging mas produktibo, kahit na hindi kasinghusay ng kanilang teoretikal na kalamangan.

Sa teorya, ang GTX 580 ay dapat na halos dalawang beses na mas mabagal kaysa sa HD 5870 at HD 6970. Sa pagsasagawa, ang pagkakaiba ay hindi kahit isa at kalahating beses. Siyempre, hindi ito gaanong nagbabago, dahil kahit na ang HD 6870 ay mas mabilis kaysa sa parehong Nvidia card sa mga naturang pagsubok, hindi banggitin ang mga nangungunang modelo. Kung hindi, ang mga solusyon ay nahulog halos naaayon sa teorya, na may ilang mga pagbubukod.

Halimbawa, naging kawili-wili ang mga resulta ng paghahambing ng bago at lumang nangungunang mga pamilya ng AMD video card. Una, ang HD 6870 ay gumanap nang kapareho sa HD 6950 sa pagsubok na ito, na may pagkakaiba sa mga teoretikal na numero na pumapabor sa modelong nakabase sa Cayman. Pangalawa, ang parehong ay masasabi tungkol sa kumbinasyon ng HD 6970 at HD 5870 - na may katulad na mga teoretikal na figure, sa katotohanan ang mas matanda, na may mga stream processor batay sa VLIW5 architecture, ay nanalo sa isang maliit na margin.

Narito muli, mayroong ilang mga posibleng paliwanag - alinman sa AMD ay hindi pa ganap na na-optimize ang mga driver para sa mga bagong GPU, o ang arkitektura ng Cayman ay hindi gaanong mahusay sa pagsubok na ito (habang ito ay lubos na posible na ito ay magiging mas epektibo sa hindi gaanong prangka na mga pagsubok) , o ang teknolohiya ng PowerTune ay naimpluwensyahan Sa pagsubok na ito, ang limitasyon ng bandwidth ng memorya ng video ay nagsimula ring tumama.

Tingnan natin ang pangalawang pagsubok sa pagkalkula ng shader, na tinatawag na Sunog. Ito ay mas mabigat para sa isang ALU, at mayroon lamang isang texture fetch, at ang bilang ng mga sin at cos na mga tagubilin ay nadoble, sa 130. Tingnan natin kung ano ang nagbago sa pagtaas ng load:

Sa pagkakataong ito, nanatili ang lahat ng GPU sa humigit-kumulang sa parehong mga posisyon, maliban sa relatibong pagganap ng Cayman at Cypress/Barts. Ngayon sa mga pares na ito ang lahat ay mahigpit na alinsunod sa mga teoretikal na peak performance figure, at ang HD 6970 ay mas nauuna pa sa HD 5870, iyon ay, sa kasong ito, ang bagong arkitektura ay gumana nang mas mahusay. At sa pares na HD 6950 at HD 6870 mayroon na ngayong isang pagkakaiba sa pabor sa nangungunang solusyon, tulad ng nararapat.

Ang natitira ay walang bago. Dahil ang bilis ng pag-render dito ay limitado lamang sa performance ng mga shader unit, ang HD 6970 at HD 5870 ang nangunguna, na sinusundan ng iba pang AMD video card, at parehong mababa ang GeForce, kabilang ang mas batang modelo mula sa ibang presyo. saklaw. Bagaman ang bentahe ng mga solusyon sa AMD ay nananatiling medyo mas mababa kaysa sa paghahambing ng mga teoretikal na numero - ito ay nagpapahiwatig na ang kahusayan ng mga superscalar processor na VLIW5 at VLIW4 ay mas mababa sa 100%.

Direct3D 10: mga pagsubok sa geometry shader

Ang RightMark3D 2.0 package ay may dalawang geometry shader speed test, ang unang opsyon ay tinatawag na "Galaxy", isang pamamaraan na katulad ng "point sprites" mula sa mga nakaraang bersyon ng Direct3D. Pina-animate nito ang isang particle system sa GPU, isang geometry shader mula sa bawat punto ay lumilikha ng apat na vertices na bumubuo ng isang particle. Ang mga katulad na algorithm ay dapat na malawakang gamitin sa hinaharap na mga laro ng DirectX 10.

Ang pagpapalit ng pagbabalanse sa mga pagsubok sa geometry shader ay hindi makakaapekto sa panghuling resulta ng pag-render, ang huling imahe ay palaging eksaktong pareho, tanging ang mga pamamaraan ng pagproseso ng eksena ang nagbabago. Tinutukoy ng parameter na "GS load" kung aling shader ang mga kalkulasyon ay isinasagawa sa - vertex o geometry. Ang bilang ng mga kalkulasyon ay palaging pareho.

Tingnan natin ang unang bersyon ng Galaxy test, na may mga kalkulasyon sa vertex shader, para sa tatlong antas ng geometric complexity:

Ang ratio ng mga bilis para sa iba't ibang geometric na kumplikado ng mga eksena ay humigit-kumulang pareho para sa lahat ng mga solusyon, ang pagganap ay tumutugma sa bilang ng mga puntos, sa bawat hakbang ang FPS ay bumaba ng halos dalawang beses. Ang gawain para sa mga modernong video card ay hindi partikular na mahirap; ang pagganap sa pangkalahatan ay limitado hindi lamang sa bilis ng pagproseso ng geometry, kundi pati na rin sa pamamagitan ng bandwidth ng memorya o rate ng pagpuno sa isang tiyak na lawak (sa loob ng isang tagagawa).

Naku, bagama't dati naming nakita ang pagtaas sa geometric na pagganap ng mga solusyon sa Barts sa pagsubok na ito, sa pagkakataong ito ang mga video card ng bagong pamilya ay naging humigit-kumulang sa parehong antas ng nakaraang henerasyong Radeon HD 5870. Marahil ang limitasyon sa pagganap ng memorya ng video ang dapat sisihin, ngunit ang HD 6870 ay napakalakas sa pagsubok na ito at nalampasan pa ang HD 6950. Kaya malamang na ang epektibong rate ng pagpuno, iyon ay, ang pagganap ng ROP, ay dapat sisihin.

Sa anumang kaso, ang lahat ng mga solusyon sa AMD ay napakalayo mula sa mga top-end na Nvidia video card, at kahit na ang pagpapatupad ng mga geometry shaders ay maaaring naging mas mahusay, ito ay malinaw na hindi sapat. Ang mga graphics card ng Nvidia batay sa GF110 ay gumaganap ng halos dalawang beses nang mas mabilis kaysa sa lahat ng mga katunggali na graphics card. Tingnan natin kung paano nagbabago ang sitwasyon kapag inilipat namin ang bahagi ng mga kalkulasyon sa geometry shader:

Kapag nagbago ang load sa pagsubok na ito, ang mga numero ay nanatiling halos hindi nagbabago para sa parehong mga solusyon sa Nvidia at AMD. Ang mga bagong video card ng pamilyang HD 6900 sa pagsubok na ito ay mahinang tumugon sa mga pagbabago sa GS load parameter, na responsable para sa paglilipat ng bahagi ng mga kalkulasyon sa geometry shader, tulad ng iba pang mga solusyon, ngunit nagpapakita pa rin ng mga resulta na bahagyang mas mataas kaysa sa nakaraang diagram . Tingnan natin kung ano ang mga pagbabago sa susunod na pagsubok, na nagsasangkot ng mabigat na pagkarga sa mga geometry shader.

Ang "Hyperlight" ay ang pangalawang pagsubok ng mga geometry shader, na nagpapakita ng paggamit ng ilang mga diskarte nang sabay-sabay: instance, stream output, buffer load. Gumagamit ito ng dynamic na paglikha ng geometry gamit ang dual-buffer rendering, pati na rin ang isang bagong feature ng Direct3D 10 - stream output. Ang unang shader ay bumubuo ng direksyon ng mga sinag, ang bilis at direksyon ng kanilang paglaki, ang data na ito ay inilalagay sa isang buffer, na ginagamit ng pangalawang shader para sa pagguhit. Para sa bawat punto ng ray, 14 na vertices ang binuo sa isang bilog, hanggang sa isang milyong output point sa kabuuan.

Ang isang bagong uri ng mga programa ng shader ay ginagamit upang makabuo ng "mga sinag", at kasama ang "GS load" na parameter na nakatakda sa "Mabigat" - upang iguhit din ang mga ito. Iyon ay, sa "Balanced" na mode, ang mga geometry shader ay ginagamit lamang upang lumikha at "lumago" na mga ray, ang output ay isinasagawa gamit ang "instancing", at sa "Heavy" mode, ang geometry shader ay kasangkot din sa output. Una naming tinitingnan ang madaling mode:

Ang mga kamag-anak na resulta sa iba't ibang mga mode ay halos tumutugma sa pagbabago sa pag-load: sa lahat ng mga kaso, ang mga antas ng pagganap ay mahusay at malapit sa mga teoretikal na parameter, ayon sa kung saan ang bawat kasunod na antas ng "bilang ng Polygon" ay dapat na mas mababa sa dalawang beses na mas mabagal.

Sa pagsubok na ito, ang bilis ng pag-render ay dapat na limitado sa pamamagitan ng geometric na pagganap, ngunit ang mga primitive na naproseso ay malinaw na hindi sapat para sa bagong arkitektura ng AMD upang gumanap nang mas mahusay, bagama't mayroong isang maliit na pagkakaiba na ipinaliwanag ng mga pagbabago sa arkitektura sa GPU.

Ang mga video card ng Nvidia ay nananatili pa ring nangunguna sa pagsubok, ngunit ang parehong Radeon HD 6970 ay halos nahuli sa mas batang modelong GTX 570. At ang HD 6950 ay nalampasan ang HD 5870, bagaman hindi masyadong marami. At ang magagandang resultang ito ay malinaw na nagpapahiwatig ng pagkakaroon ng mga pag-optimize para sa pagproseso ng geometric na data sa mga bagong chip.

Dapat magbago ang mga numero sa susunod na diagram, sa isang pagsubok na may mas aktibong paggamit ng mga geometry shader. Magiging kawili-wili din na ihambing ang mga resulta na nakuha sa "Balanse" at "Mabigat" na mga mode sa bawat isa.

Ngunit sa pagsubok na ito, ang pagkakaiba sa pagitan ng AMD chips na may tradisyunal na graphics pipeline (kabilang ang Cayman kasama ang dalawang rasterizer nito) at mga chip na may Fermi architecture ay kapansin-pansin kaagad. Bagama't alam natin mula sa mga nakaraang pag-aaral na ang mga low-end na Nvidia chips ay nahuhuli sa mga tuntunin ng bilis ng pagpapatupad ng mga geometry shaders, na nagpapakita ng hindi gaanong kahanga-hangang mga resulta, dahil ang kanilang mga geometric na kakayahan sa pagproseso ay nabawasan. Ngunit ang mga resulta ng GTX 570 at GTX 580, batay sa GF110 chip, ay napakahusay at halos dalawang beses na mas mataas kaysa sa pinakamahusay na solusyon sa AMD.

At ang solusyon na ito ay ang bagong Radeon HD 6970. Ang mga kakayahan ng bagong nangungunang chip para sa pagproseso ng geometry at ang bilis ng pagpapatupad ng mga geometry shaders ay malinaw na tumaas kumpara sa iba pang mga video card mula sa kumpanya. At ang mga bagong solusyon batay sa Cayman ay nagpapakita ng mga resulta sa mga pagsubok na ito na mas mataas kaysa sa mga solusyon batay sa Cypress at Barts, bagaman hindi tatlong beses, o kahit dalawang beses. Malamang, kailangan pa ring lutasin ng mga inhinyero ng AMD ang problema ng pagpaparis sa gawain ng mga bloke ng pag-install ng tatsulok (geometry setup), kung saan maaaring tumakbo ang mga pagsubok na ito.

Direct3D 10: bilis ng pagkuha ng texture mula sa mga vertex shader

Sinusukat ng mga pagsusulit ng Vertex Texture Fetch ang bilis ng malaking bilang ng mga texture fetch mula sa vertex shader. Ang mga pagsubok ay halos magkapareho, kaya ang ratio sa pagitan ng mga resulta ng mga card sa mga pagsubok sa Earth at Waves ay dapat na halos pareho. Ang parehong mga pagsubok ay gumagamit ng displacement mapping batay sa texture sample data, ang tanging makabuluhang pagkakaiba ay ang "Waves" na pagsubok ay gumagamit ng mga conditional branch, habang ang "Earth" na pagsubok ay hindi.

Tingnan natin ang unang pagsubok na "Earth", una sa mode na "Mababa ang detalye ng epekto":

Ipinakita ng nakaraang pananaliksik na ang mga resulta ng pagsubok na ito ay apektado ng parehong bilis ng texturing at bandwidth ng memorya. Ito ay malinaw na nakikita sa mga paghahambing na resulta ng Radeon HD 5870 at HD 6950, at iba pang mga solusyon sa AMD. Tila ang bandwidth ng memorya ang naglilimita sa kanilang pagganap sa pagsubok, kaya ang pagkakaiba sa pagitan ng lahat ng mga solusyon ay hindi ganoon kaganda.

Gayunpaman, ang HD 6970 ay nagpapakita ng napakagandang resulta sa bagong GPU - halos tumugma ito sa GTX 570, kung saan ang modelong ito ay kailangang makipagkumpitensya sa totoong mundo. Well, ang pinuno ay nananatiling pinakamahal at produktibong GTX 580. Ang parehong mga card ng pamilya HD 6900 ay gumanap nang mahusay, ang pinakabatang bagong modelo ay halos kapareho ng nakaraang top-end na isa. Tingnan natin ang pagganap sa parehong pagsubok na may tumaas na bilang ng mga sample ng texture:

Ang relatibong posisyon ng mga card sa diagram ay kapansin-pansing nagbago, lalo na sa hard mode. Kahit na ang Nvidia video card sa ilang kadahilanan ay nawalan ng pagganap nang tumpak sa pinakamadaling kundisyon. Sa isang maliit na bilang ng mga polygon, ang bilis ay nalilimitahan ng memory bandwidth, at sa kasong ito, ang mga bagong AMD board ay halos nahuli sa mga nangungunang solusyon ng kakumpitensya.

Ngunit sa mabibigat na mga mode, ang pagkakaiba sa pabor sa Nvidia ay lumaki sa isa at kalahating beses, kung saan ang GTX 580 at GTX 570 ay nananatiling hindi maabot ng kanilang mga karibal. Ang senior video card ng HD 6900 na pamilya ay higit na gumaganap sa iba pang mga solusyon sa AMD, bagaman ito ay muli na halos hindi kapansin-pansin kung ihahambing sa HD 5870. Maaaring pag-usapan ng isa ang tungkol sa impluwensya ng memory bandwidth, ngunit hindi nito pinipigilan ang kakumpitensya...

Tingnan natin ang mga resulta ng pangalawang pagsubok ng mga texture fetch mula sa vertex shaders. Ang Waves test ay may mas maliit na bilang ng mga sample, ngunit gumagamit ito ng mga conditional jump. Ang bilang ng mga sample ng bilinear texture sa kasong ito ay hanggang 14 (“Mababa ang detalye ng epekto”) o hanggang 24 (“Mataas na detalye ng epekto”) bawat vertex. Ang pagiging kumplikado ng geometry ay nagbabago nang katulad sa nakaraang pagsubok.

Kapansin-pansin, ang mga resulta sa pangalawang "Waves" vertex texturing test ay hindi katulad ng nakita natin sa mga nakaraang chart. Sa pagsubok na ito, ang lahat ng AMD at Nvidia video card ay nagpapakita ng napakalapit na mga resulta, na maaari ding maiugnay sa limitasyon ng bandwidth ng memorya ng video. Ang figure na ito para sa lahat ng ipinakitang video card ay nasa rehiyon na 130-190 GB/s, at maliit ang spread. Ang pinakabagong modelong Radeon HD 6970 ay muling naging pinakamahusay sa mga AMD video card. Isaalang-alang natin ang pangalawang bersyon ng parehong pagsubok:

At muli, ang mga pagbabago ay naganap na katulad ng nakita natin kanina - Ang mga video card ng Nvidia ay "sagged" lamang sa madaling mode, at AMD sa lahat ng tatlo. At samakatuwid, sa mode na may isang maliit na bilang ng mga polygon, ang pagkakaiba sa pagitan ng mga solusyon ay maliit, ngunit sa katamtaman at mabigat na mga mode, ang GTX 580 at GTX 570 ay kapansin-pansing nangunguna sa lahat ng mga modelo ng Radeon, kabilang ang mga mula sa HD 6900 na pamilya na inihayag. ngayon. Kumpara sa Cypress, ang bagong GPU ay nagpapakita ng mga resulta ng humigit-kumulang sa parehong antas, at napagpasyahan namin na walang mga kapansin-pansing pagbabago sa vertex sampling test kapag lumilipat mula sa Cypress patungong Cayman.

3DMark Vantage: Mga pagsubok sa tampok

Maaaring ipakita sa amin ng mga sintetikong pagsubok mula sa 3DMark Vantage ang isang bagay na dati naming napalampas. Ang mga feature na pagsubok ng test package na ito ay sumusuporta sa DirectX 10 at kawili-wili dahil iba ang mga ito sa atin. Kapag sinusuri ang mga resulta ng mga bagong video card sa package na ito, makakagawa kami ng ilang bago at kapaki-pakinabang na konklusyon na hindi namin nakuha sa mga pagsubok sa pamilya ng RightMark. Sa kasamaang palad, ang mas bagong pakete ng pagsubok ng kumpanya - 3DMark11 - ay hindi naglalaman ng mga dalubhasang sintetikong pagsubok at hindi talaga kawili-wili sa amin sa kasong ito.

Feature Test 1: Texture Fill

Ang unang pagsubok ay isang texture fetch speed test. Kabilang dito ang pagpuno sa isang parihaba ng mga value na nabasa mula sa isang maliit na texture gamit ang maramihang mga coordinate ng texture na nagbabago sa bawat frame.

Bagama't hindi rin ipinapakita ng texture test ng Futuremark ang teoretikal na posibleng antas ng bilis ng pagkuha ng texture, ang kahusayan ng mga bagong video card ng pamilyang Radeon HD 6900 ay bahagyang mas mataas pa kaysa sa atin. At ginagamit din ng mga solusyon sa Nvidia ang mga kasalukuyang unit ng texture nang mas mahusay. Samakatuwid, sa pagsubok sa texture na ito ay nakakakuha tayo ng bahagyang naiibang ratio ng mga resulta kumpara sa atin.

Ang bagong pamilya ng mga video card ng AMD ay nagpapakita ng mga resulta na ganap na sumusunod sa mga teoretikal na parameter. Ang HD 6950 ay bahagyang mas mabilis kaysa sa HD 5870, at ang HD 6970 ang malinaw na nagwagi sa pagsubok. Malinaw mong makikita na ang pagganap ng textural ng Cayman ay tumaas nang malaki kumpara sa Cypress. Ngunit ang HD 6870 batay sa Barts chip ay nagpapakita pinakamasamang resulta, katulad ng mga numero ng nangungunang Nvidia video card. Well, ang GTX 570 ay mas mababa sa lahat sa texturing, tulad ng sa aming pagsubok.

Feature Test 2: Color Fill

Isa itong pagsubok sa rate ng pagpuno. Gumagamit ng napakasimpleng pixel shader na hindi naglilimita sa pagganap. Ang interpolated na value ng kulay ay isinusulat sa isang off-screen na buffer (target sa pag-render) gamit ang alpha blending. Ginagamit ang 16-bit na off-screen buffer ng format na FP16, na kadalasang ginagamit sa mga laro na gumagamit ng HDR rendering, kaya napapanahon ang pagsubok na ito.

Ang sitwasyon ay ganap na naiiba sa pagsubok ng pagganap ng mga bloke ng ROP. Ang mga numero sa subtest na ito ng 3DMark Vantage ay nagpapakita ng pagganap ng mga yunit ng ROP, halos hindi naaapektuhan ng dami ng bandwidth ng memorya ng video. Ang HD 6970 na modelo ay nagpapakita ng mahusay na mga resulta, halos nakakakuha ng top-end na GTX 580 at nangunguna sa katunggali nitong GTX 570.

Sa turn, ang HD 6950 ay hindi lamang nangunguna sa kakumpitensyang GTX 570, kundi pati na rin sa hinalinhan nito, ang HD 5870. Napansin namin ang bahagyang mas mataas na kahusayan ng mga yunit ng ROP at mas mataas na rate ng pagpuno sa mga bagong modelo ng AMD video card kumpara sa mas lumang mga chips.

Feature Test 3: Parallax Occlusion Mapping

Isa sa mga pinaka-kagiliw-giliw na mga pagsubok sa tampok, dahil ang isang katulad na pamamaraan ay ginagamit na sa mga laro. Gumuhit ito ng isang quadrilateral (mas tiyak, dalawang triangles) gamit ang isang espesyal na Parallax Occlusion Mapping technique na ginagaya ang kumplikadong geometry. Gumagamit ng medyo resource-intensive ray tracing operations at isang high-resolution na depth map. Ang ibabaw na ito ay nililiman din gamit ang isang mabigat na Strauss algorithm. Ito ay isang pagsubok ng isang napaka-kumplikado at mabigat na pixel shader para sa isang video chip, na naglalaman ng maraming mga sample ng texture sa panahon ng ray tracing, dynamic na sumasanga at kumplikadong pagkalkula ng ilaw ayon kay Strauss.

Ang pagsubok na ito ay naiiba sa iba mga katulad na paksa, na ang mga resulta dito ay hindi lamang nakadepende sa bilis ng mathematical calculations o sa kahusayan ng branch execution o sa bilis ng texture fetch, ngunit sa kaunting lahat. At upang makamit ang mataas na bilis, ang balanse ng mga bloke ng GPU ay mahalaga. Nakakaapekto sa bilis at kahusayan ng pagsasanga sa mga shader.

Ang tsart ng paghahambing sa pagitan ng mga graphics card ng AMD ay halos kapareho sa nakita namin sa pagsubok sa pagganap ng texture mula sa 3DMark Vantage. Ngunit ang mga Nvidia board sa kasong ito ay nakatanggap ng bahagyang pagtaas sa pagganap, na nagmumungkahi na hindi lamang ang pagganap ng texture ang nakakaapekto sa mga resulta ng pagsubok.

Ang mga bagong modelo ng AMD ay muling seryosong iginiit ang kanilang mga sarili, na nalampasan ang kanilang hinalinhan sa anyo ng HD 5870. Ngunit ang HD 6870 mula sa ibang sektor ng presyo ay nagpakita ng isang kapansin-pansing mas mahinang resulta, na naging isang tagalabas sa pagsubok na ito (na kung saan ay medyo pinapagaan ng mababang presyo). Tulad ng para sa paghahambing ng Cayman sa mga nakikipagkumpitensyang solusyon sa Nvidia, ang parehong mga bagong video card ng pamilyang HD 6900 ay nauuna kahit sa nangungunang modelo sa linya ng GeForce GTX 500.

Feature Test 4: GPU Cloth

Ang pagsusulit ay kawili-wili dahil kinakalkula nito ang mga pisikal na pakikipag-ugnayan (fabric imitation) gamit ang isang video chip. Ginagamit ang vertex simulation, gamit ang pinagsamang gawain ng vertex at geometry shaders, na may ilang pass. Gumamit ng stream out upang maglipat ng mga vertex mula sa isang simulation pass patungo sa isa pa. Kaya, ang pagganap ng pagpapatupad ng vertex at geometry shaders at ang bilis ng stream out ay nasubok.

Ang bilis ng pag-render sa pagsubok na ito ay nakasalalay sa maraming mga parameter, ngunit ang mga pangunahing ay ang pagganap ng pagproseso ng geometry at kahusayan sa pagpapatupad ng geometry shader. Makatuwiran na ang mga video card na ginawa ng Nvidia ay parang isda sa tubig sa application na ito, at mas nauuna sa kanilang mga kakumpitensya, kabilang ang mga nangungunang modelo na ipinakita ngayon.

Ito ay isa sa ilang mga pagsubok na walang tessellation, kung saan makikita ang bentahe ng kamakailang ipinakilalang mga video card ng bagong Radeon HD 6800 series at ng mga bayani ngayon HD 6900. Ang bilis ng pag-render ng lahat ng mga modelong ito sa pagsubok na ito ay mas mataas kaysa sa ang nangungunang modelo ng nakaraang linya. Ito ay dahil parehong pinataas nina Barts at Cayman ang bilis ng pagproseso ng geometry at pagpapatupad ng geometry shader. At bagama't kahit na ang HD 6970 ay patuloy na seryosong nahuhuli sa GTX 570, ang bagong modelo ay napabuti pa rin ang posisyon ng AMD sa pagsubok na ito.

Pagsubok sa Tampok 5: Mga Particle ng GPU

Pagsubok ng pisikal na simulation ng mga epekto batay sa mga particle system na kinakalkula gamit ang isang video chip. Ginagamit din ang vertex simulation, ang bawat vertex ay kumakatawan sa isang particle. Ginagamit ang stream out para sa parehong layunin tulad ng sa nakaraang pagsubok. Ilang daang libong mga particle ang kinakalkula, lahat ay animated nang hiwalay, at ang kanilang mga banggaan sa taas na mapa ay kinakalkula din.

Katulad ng isa sa aming mga pagsubok sa RightMark3D 2.0, nire-render ang mga particle gamit ang isang geometry shader na lumilikha ng apat na vertice mula sa bawat punto upang bumuo ng isang particle. Ngunit ang pagsubok na karamihan sa lahat ay naglo-load ng mga shader unit na may mga kalkulasyon ng vertex; sinusubok din ang stream out.

Ang mga resulta ng susunod na pagsubok mula sa pakete ng 3DMark Vantage ay katulad ng nakita natin sa nakaraang diagram, ngunit sa loob nito ang bilis ng pagproseso ng geometry ay mas mahalaga. Iyon ang dahilan kung bakit ang nakaraang henerasyon sa anyo ng Radeon HD 5870 card ay nahuli sa likod ng parehong mga modelo ng GeForce, na kung saan ay ang hindi mapag-aalinlanganang mga pinuno kung ihahambing, at lahat ng mga bagong modelo ng AMD video card, ang HD 6900 at HD 6800 na mga pamilya. At lahat ng board ay nakabatay sa sa Cayman at Barts ay nagpakita ng mas mahusay na mga resulta kaysa sa tanging solusyon sa Cypress, pangalawa lamang sa malalakas na kakumpitensya.

Lumalabas na sa synthetic na fabric at particle simulation na mga pagsubok mula sa 3DMark Vantage benchmark suite, na malawakang gumagamit ng geometry shaders, muli ay walang makabuluhang epekto ng parallelized geometry processing sa Cayman, dahil nagpakita si Barts ng katulad na resulta. Samakatuwid, ang parehong mga solusyon ng linya ng HD 6900 ay patuloy na nahuhuli sa mga nakikipagkumpitensyang video card ng kanilang mga kalaban, na may mahusay na bilis ng pagproseso ng geometry - hanggang sa dalawang beses na mas mataas. Inaasahan pa rin namin ang kaunting pag-unlad mula sa nangungunang solusyon ng AMD, batay sa isang bagong arkitektura na may dalawang yunit ng pagproseso ng geometry.

Feature Test 6: Perlin Noise

Ang huling feature test ng Vantage package ay isang mathematically intensive test ng video chip; kinakalkula nito ang ilang octaves ng Perlin noise algorithm sa pixel shader. Ang bawat channel ng kulay ay gumagamit ng sarili nitong function ng ingay upang bigyan ng higit na diin ang video chip. Ang Perlin noise ay isang karaniwang algorithm na kadalasang ginagamit sa procedural texturing, at gumagamit ito ng maraming mathematical calculations.

Sa isang purong mathematical na pagsubok mula sa Futuremark package, na nagpapakita ng pinakamataas na pagganap ng mga video chip sa matinding gawain, nakakita kami ng mas kawili-wiling larawan kaysa sa mga katulad na pagsubok mula sa aming test package. Ang pagganap ng mga solusyon na ipinapakita sa diagram ay tinatayang tumutugma lamang sa kung ano ang dapat makuha ayon sa teorya at medyo salungat sa nakita natin kanina sa mga pagsusulit sa matematika mula sa pakete ng RightMark 2.0.

Kahit na mula sa mga teoretikal na katangian ng bagong HD 6970 at HD 6950 na mga modelo, malinaw na hindi nila napataas ang pinakamataas na pagganap ng mga kalkulasyon sa matematika kumpara sa HD 5870. Ngunit gayon pa man, hindi namin inaasahan ang isang malinaw na lag. Oo, ang parehong mga board ay lumampas sa kanilang mga kakumpitensya mula sa Nvidia sa pamamagitan ng isang malaking margin, ngunit kami ay ginagamit na ito, dahil ang GeForce video card ay hindi nagpapakita ng napakahusay na mga resulta sa mga ganitong kaso; ang simple at masinsinang matematika ay ginagawa nang mas mabilis sa Radeon.

Ang hindi inaasahan ay ang bagong mas lumang modelo ay nawalan ng 7% sa nakaraang nangungunang modelo, bagama't ayon sa teorya ay dapat itong mawalan ng hindi hihigit sa 1%. Dito muli ay maaaring magsimulang hulaan kung ano ang naging sanhi ng pagkawalang ito sa kanyang hinalinhan. Alinman ito ay dahil sa kakulangan ng pag-optimize ng driver para sa mga bagong solusyon, o ang mas mababang kahusayan ng arkitektura ng VLIW4 sa mga naturang pagsubok, o isang sobrang matalinong sistema ng pamamahala ng kuryente sa mga bagong modelo, na "pinatay" ang dalas ng orasan at pagganap ng mga solusyon kapag ang naabot ang limitasyon ng pagkonsumo ng kuryente.

Direct3D 11: Compute Shaders

Upang subukan ang mga bagong solusyon ng AMD sa mga gawain na gumagamit ng mga bagong feature ng DirectX 11 gaya ng tessellation at compute shaders, gumamit kami ng mga sample mula sa mga SDK at demo mula sa Microsoft, Nvidia, at AMD.

Una, tingnan natin ang mga pagsubok na gumagamit ng Compute shaders. Ang kanilang hitsura ay isa sa pinakamahalagang inobasyon sa mga pinakabagong bersyon ng DX API, ginagamit na ang mga ito sa mga modernong laro para magsagawa ng iba't ibang gawain: post-processing, simulation, atbp. Ang unang pagsubok ay nagpapakita ng halimbawa ng HDR rendering na may tone mapping mula sa DirectX SDK, na may post-processing , gamit ang pixel at compute shaders.

Marahil ang halimbawang ito para sa mga computational shader ay hindi ang pinakamahusay, ngunit kakaunti pa ang mga ito. Ang lahat ng mga video card ay nagpapakita ng mga katulad na resulta sa pagsubok na ito, ngunit ang nangungunang modelo na Geforce GTX 580 ay nanalo pa rin. Ang mga card na inihayag ngayon sa bagong Cayman chip ay bahagyang mas mababa dito, at kapag gumagamit lamang ng isang pixel shader. Ang direktang katunggali ng mga bagong solusyon ng AMD, ang GTX 570 video card, ay nahuhuli sa kanila sa parehong mga mode: parehong gumagamit ng pixel at gumagamit ng mga shader ng compute.

Ang pangalawang compute shader test ay kinuha din mula sa Microsoft DirectX SDK at nagpapakita ng computational N-body gravity problem - isang simulation ng isang dynamic na particle system na napapailalim sa pisikal na pwersa gaya ng gravity.

Ngunit narito ang mas kawili-wiling mga resulta, para sa mga solusyon sa AMD na medyo katulad ng mga numero mula sa 3DMark Vantage mathematical test. Sa kabila ng malaking teoretikal na bentahe sa mga peak na numero, ang pinakamabilis na Radeon HD 5870 graphics card ay nauuna lamang nang bahagya sa pinakamahusay na solusyon ng Nvidia. At ang parehong mga bagong modelo ng pamilyang HD 6900 ay nagpapakita ng mga resulta na malapit sa kanilang direktang kakumpitensya - Geforce GTX 570.

Ngunit ngayon kami ay mas interesado sa pagkakaiba sa pagitan ng mga resulta ng mga solusyon sa Cayman at Cypress, at narito muli naming nakikita kung paano nanalo ang lumang video card, at kung ano ang isang kalamangan! 17% sa pagitan ng HD 5870 at HD 6970 na pabor sa nauna - muling ipinapakita ng mga pagsusulit sa matematika ang pagkakaiba sa pagitan ng magandang teorya at brutal na kasanayan. Well, nasaan ang mga application kung saan maipapakita ng bagong GPU ang lakas nito? Marahil sa mga pagsubok sa tessellation ang lahat ay sa wakas ay mahuhulog sa lugar.

Direct3D 11: Pagganap ng Tessellation

Napakahalaga ng mga compute shader, ngunit ang pangunahing inobasyon sa Direct3D 11 ay hardware tessellation pa rin. Tiningnan namin ito nang detalyado sa aming teoretikal na artikulo tungkol sa Nvidia GF100. Matagal nang ginagamit ang Tessellation sa mga laro ng DX11, tulad ng STALKER: Call of Pripyat, DiRT 2, Aliens vs Predator, Metro 2033, Civilization V at iba pa. Ang ilan sa kanila ay gumagamit ng tessellation para sa mga modelo ng character (lahat ng mga laro sa FPS na nakalista), ang iba pa - upang gayahin ang isang makatotohanang ibabaw ng tubig (DiRT 2) o landscape (Civilization V).

Mayroong ilang iba't ibang mga scheme para sa paghahati ng mga graphic primitive (tessellation). Halimbawa, phong tessellation, PN triangles, Catmull-Clark subdivision. Ang PN Triangles tessellation scheme ay ginagamit sa STALKER: Call of Pripyat, at sa Metro 2033 - Phong tessellation. Ang mga pamamaraan na ito ay medyo mabilis at madaling ipinatupad sa proseso ng pagbuo ng laro at mga umiiral na makina, kaya naman naging popular ang mga ito.

Ang unang pagsubok sa tessellation ay ang halimbawa ng Detalye ng Tessellation mula sa ATI Radeon SDK. Ipinapakita nito hindi lamang ang tessellation, kundi pati na rin ang dalawang magkaibang diskarte sa pagpoproseso ng pixel-by-pixel: simpleng normal na overlay ng mapa at parallax occlusion mapping. Well, ihambing natin ang mga solusyon sa AMD at Nvidia DX11 sa iba't ibang kundisyon:

Tingnan muna natin ang mga diskarte sa pixel-by-pixel. Ang parallax occlusion mapping (mga gitnang bar sa diagram) sa mga video card mula sa parehong mga tagagawa ay hindi gaanong mahusay kaysa sa tessellation (mga ibabang bar), at ang katamtamang tessellation ay hindi nagbibigay ng malaking pagkahulog pagganap - ihambing ang itaas at ibabang mga bar. Ibig sabihin, ang mataas na kalidad na imitasyon ng geometry gamit ang mga kalkulasyon ng pixel ay nagbibigay ng mas mababang pagganap kaysa sa tessellated geometry na may displacement mapping.

Tulad ng para sa pagganap ng mga video card na may kaugnayan sa isa't isa, ang pinakamahalagang konklusyon dito ay ang AMD video card ay bahagyang mas mabilis kaysa sa Nvidia card sa pinakamadaling mode, ngunit mas mabagal sa kumplikadong mga kalkulasyon ng pixel-by-pixel (tandaan ang parallax mapping tests nang mas maaga. ). At bago ang paglabas ng mga Cayman board, ang mga Geforce card ay bahagyang mas mabilis kaysa sa mga solusyon sa AMD kahit na pinagana ang tessellation.

Ngunit ngayon ang pagkakaiba sa bilis ng pagproseso ng geometry sa pagitan ng HD 6900 at HD 5870 ay malinaw na nakikita - ang mga bagong Cayman-based na board ay naging kapansin-pansing mas mabilis kaysa sa Cypress sa tessellation subtest. Sa pagsubok na ito na may maliit na triangle split ratio, nalampasan pa ng HD 6970 ang katunggali nito, ang GTX 570, sa isang magandang margin.

Ang pangalawang pagsubok sa pagganap ng tessellation ay isa pang halimbawa para sa mga 3D developer mula sa ATI Radeon SDK - PN Triangles. Sa totoo lang, ang parehong mga halimbawa ay kasama rin sa DX SDK, kaya sigurado kami na ang mga developer ng laro ay gagawa ng kanilang code batay sa kanila. Sinubukan namin ang halimbawang ito gamit ang iba't ibang salik ng tessellation upang maunawaan kung gaano kalaki ang epekto ng pagbabago nito sa pangkalahatang pagganap.

Sa halimbawang ito lamang natin makikita sa unang pagkakataon ang isang tunay na kumpletong paghahambing ng geometriko na kapangyarihan ng mga solusyon sa AMD at Nvidia. Parehong namumukod-tangi ang Fermi graphics architecture at ang bagong AMD GPU sa ilalim ng pangalang Cayman. Isinasantabi ang katotohanan na ito ay isang puro sintetikong pagsubok at ang gayong matinding partitioning ratio ay hindi gagamitin sa mga laro ngayon, interesado na kami ngayon sa potensyal. Pagkatapos ng lahat, kailangan ang synthetics upang masuri ang mga prospect at pagkakaiba sa pagitan ng iba't ibang solusyon.

Kaagad na malinaw na imposibleng makipagkumpitensya sa Nvidia Geforce video card sa GF110 chip; sa matinding mga gawain sa tessellation ay maraming beses silang mas mabilis kaysa sa na-update na arkitektura ng AMD. Ngunit ito ay isang arkitektura na partikular na idinisenyo mula sa simula na isinasaalang-alang ang mga kakayahan ng bagong API. Paano ang Cayman? Kung ikukumpara sa Cypress, lahat ay napakahusay!

Ang mga bagong modelo ng AMD ay nagpapakita ng isang kahanga-hangang pagtaas sa bilis sa mga mode ng katamtamang pag-load, at ang pagkakaiba kumpara sa HD 5870 ay umabot ng higit sa dalawang beses. Gayunpaman, hindi namin palaging nakikita ang gayong pagtaas, at kadalasan ay nahuhulog ito sa loob ng isa at kalahating beses. Tayo, ayon sa ipinangakong tatlong beses na pagkakaiba, kahit na, tiyak na hindi namin ito nakita. Ibig sabihin, bagama't pinaliit ng Cayman ang agwat mula sa katunggali nito sa mga gawain sa pagproseso ng geometry, napakalayo pa rin nito sa parallel operation ng 16 tessellation units sa GF110.

Sa kabilang banda, ang pinakamalaking pagkakaiba sa pagitan ng mga solusyon mula sa iba't ibang kumpanya ay nakakamit sa mga kondisyon ng matinding tessellation, na wala at hindi pa inaasahan sa mga totoong laro. Samakatuwid, malamang, makabuluhang palalakasin ni Cayman ang posisyon ng AMD sa mga umiiral na benchmark sa paglalaro gamit ang tessellation. Lalo na kung ang partitioning factor ay hindi masyadong malaki, tulad ng sa 3DMark11 tests.

Tingnan natin ang isa pang pagsubok, ang demo ng Nvidia Realistic Water Terrain, na kilala rin bilang Island. Gumagamit ang demo na ito ng tessellation at displacement mapping para mag-render ng makatotohanang hitsura ng mga ibabaw at terrain ng karagatan. Mukhang maganda lang, narito ang kulang sa mga kasalukuyang laro:

Ang Island ay hindi isang puro synthetic na pagsubok para sa pagsukat ng geometry performance; naglalaman ito ng mga kumplikadong pixel at compute shader, kaya ang pagkakaiba sa performance ay maaaring mas mababa kaysa sa nakaraang kaso, ngunit ang load na ito ay mas malapit sa mga totoong laro na gumagamit ng lahat ng GPU block nang sabay-sabay.

Sinubukan namin ang programa sa apat na magkakaibang ratio ng tessellation, ang setting na ito ay tinatawag na Dynamic Tessellation LOD. Kung nasa pinakamababang partitioning factor ang AMD video card ay nauuna, kung gayon habang ang trabaho ay nagiging mas kumplikado, ang mga board batay sa GF110 ay agad na tumalon sa malayo. Habang tumataas ang salik ng partitioning at pagiging kumplikado ng eksena, ang pagganap ng lahat ng Radeon ay lubhang bumababa, taliwas sa bilis ng mga nakikipagkumpitensyang solusyon.

Bukod dito, sa pagkakataong ito ang HD 5870 sa ilang kadahilanan ay nauuna pa sa parehong mga modelo ng bagong pamilya. Iyon ay, mayroong isang pagkakaiba na kabaligtaran sa teorya sa isang problema sa kumplikadong geometry. At maaari lamang magkaroon ng isang paliwanag para dito - ang kakulangan ng pag-optimize ng driver para sa bagong arkitektura, dahil sa mga nakaraang pagsubok nakita namin ang malinaw na kalamangan nito sa Radeon HD 5870, batay sa Cypress chip. Buweno, sa pagsubok na ito, napipilitan tayong aminin ang pagkatalo ng Cayman - sa pinakamataas na koepisyent ng LOD, ang pagkakaiba sa pagitan ng bilis ng GeForce at ng Radeon ay umabot ng 4-6 na beses!

Mga konklusyon sa mga sintetikong pagsubok

Batay sa mga resulta ng mga sintetikong pagsusuri ng mga video card mula sa bagong Radeon HD 6900 na pamilya, batay sa Cayman graphics processor, pati na rin ang mga resulta ng iba pang mga modelo ng video card na ginawa ng parehong mga tagagawa ng discrete video chips, maaari nating tapusin na ang bagong ang mga produkto ay isang mahusay na kapalit para sa Radeon HD 5800 na linya, kahit na hindi masyadong naiiba mula dito sa mga tuntunin ng pagganap, hindi bababa sa mga synthetic na pagsubok.

Ang Cayman GPU ay batay sa isang bagong arkitektura at naiiba sa mga nakaraang chip sa hardware, bagaman ang bilang ng ilang mga yunit ng pagpapatupad dito ay hindi tumaas. Ngunit ang bagong GPU ay nagtatampok ng mga pagpapahusay sa arkitektura na naglalayong pataasin ang kahusayan ng GPU computing (wala kaming mga ganoong pagsubok) at, higit sa lahat, pinapagaan ang mahalagang agwat mula sa kakumpitensya sa anyo ng pagganap ng pagproseso ng geometry. Marami sa mga synthetic na pagsubok ay nagpapakita na ang bilis ng tessellation at pagpapatupad ng mga geometry shaders ay kapansin-pansing tumaas, bagaman hindi palaging ilang beses tulad ng ipinangako.

Salamat sa mga pagbabago sa arkitektura at mga katangian ng dalas ng mga ito, ang mga resulta ng mga video card ng bagong serye sa maraming sintetikong pagsubok ay mapagkumpitensya para sa kanilang sektor ng presyo, lalo na kung ikukumpara sa direktang katunggali na Geforce GTX 570. Ito ay mas malinaw na nakikita sa mga pagsusulit sa pag-compute mula sa Mga pakete ng RightMark at Vantage. At sa iba pang mga application, ang mga solusyon ng HD 6900 na pamilya ay nagpakita ng mahusay na bilis, kadalasang pangalawa lamang sa nangungunang Nvidia video card.

Sa kasamaang palad, may mga hindi masyadong kaaya-ayang sorpresa. Sa kabila ng mas malaking kumplikado at lugar ng chip kumpara sa Cypress, ang HD 6900 na mga modelo ay gumanap na mas mababa kaysa sa HD 5870 sa ilang mga pagsusulit sa matematika, na hindi madaling ipaliwanag, at hindi pa kami sigurado sa mga dahilan para sa lag na ito. Marahil ang kakulangan ng pag-optimize ng driver ay dapat sisihin, o marahil ang kahusayan ng bagong arkitektura ng VLIW4 ay mas mababa sa aming mga pagsubok. Malamang din na ang sistema ng pamamahala ng kapangyarihan sa mga bagong modelo ay nagpababa sa mga bilis ng orasan kapag naabot ang maximum na pagkonsumo ng kuryente sa hinihingi ng mga sintetikong pagsubok, na hindi nagpapahintulot sa kanila na ipakita ang inaasahang pagganap batay sa bilang ng mga bloke at ang kanilang bilis ng orasan.

Tiyak na marami ang inaasahan na ang Radeon HD 6970 ay maaaring makipagkumpitensya sa pantay na mga termino sa GTX 580 sa lahat ng mga pagsubok, ngunit hindi ito nangyari, kahit na ang mga resulta ay ipinakita na napakahusay at medyo pare-pareho sa mga inirerekomendang presyo para sa mga modelong inihayag. ngayon. Ipinapalagay namin na ang mga resulta ng Radeon HD 6970 at HD 6950 sa mga synthetic na pagsubok ay makukumpirma ng mga kaukulang numero sa bahagi ng "laro" ng aming materyal. Sa mga laro, ang mas lumang HD 6970 ay dapat gumanap ng humigit-kumulang sa antas ng GTX 570, sa ilang mga pagsubok ay medyo mabagal, at sa iba pa - mas mabilis, at ang HD 6950, kahit na ito ay mas mabagal kaysa sa modelong Nvidia na ito, ay mas mababa din ang presyo. . Kaya't mabilis tayong magpatuloy sa paggalugad ng bilis sa mga laro!

Ang AMD Radeon HD 6800 Series video card ay isang serye ng mga graphics chips mula sa AMD na medyo sikat sa isang pagkakataon. Ngayon, ang mga video card na ito ay maaaring gamitin sa mga legacy system at mababa ang pagganap ayon sa mga modernong pamantayan. Gayunpaman, pinapayagan ng mga katangian ng AMD Radeon HD 6800 Series ang paggamit ng mga chip na ito sa mga ordinaryong desktop computer, na hindi nakatalaga sa pagpapatakbo ng mga modernong release ng laro.

Hitsura ng serye

Alam ng mga taong sumusunod sa mga kaugnay na balita na regular na ina-update ng AMD ang serye ng mga graphics chip nito. Ang 2010 ay walang pagbubukod, at pagkatapos ay lumitaw ang isang serye ng mga video card ng AMD Radeon HD 6800 Series, na ang mga katangian ay kahanga-hanga. Ang mga modelo sa seryeng ito ay idinisenyo upang palitan ang flagship Radeon HD 5870 video card noon.

Noong Oktubre 22, ipinakita ang unang modelo mula sa seryeng ito. Pagkatapos sa panahon ng pagtatanghal nakolekta niya ang mga positibong pagsusuri. Tandaan na sa linyang ito nakumpleto ang rebranding. Simula sa seryeng ito, ang mga video card ng gumawa ay tinawag na AMD, hindi ATI.

Alamin natin kung ano ang mga katangian ng AMD Radeon HD 6800 Series at ano ang bago sa linyang ito? Paalalahanan ka namin na mayroon lamang 2 video card sa serye - ang mga modelong HD6850 at HD6870. Ayon sa mga developer, ang numero 8 sa pangalan ay hindi na tumutukoy sa mga pangunahing ambisyon ng mga video card sa seryeng ito mula nang lumitaw ang 6900 na linya.

Mga katangian ng AMD Radeon HD 6800 Series video card

Magsimula tayo sa mga halatang pagbabago. Ginamit ng linya ang bagong processor ng Barts. Mula sa pagtatanghal ay malinaw na ang AMD ay sumusunod sa ibang landas ng pag-unlad, na naiiba sa napiling landas ng Nvidia. Kung hinahabol ng mga developer ng Nvidia ang kapangyarihan at pagganap ng kanilang mga platform, inuuna ng AMD ang balanse sa pagitan ng gastos at pagganap.

Kung ang ATI ay dati nang nagtakda ng mga uso sa mga tuntunin ng pagbuo ng mga graphics chip, pagkatapos ay sa ilalim ng pakpak ng AMD ang developer ay tumalikod. Ang Barts GPU ay tiyak na mas mahina kaysa sa hinalinhan nito - sa mga detalye at sa papel. Ang katotohanan ay pinili ng mga developer na gawing simple ang arkitektura upang matiyak ang pagiging maaasahan at lumikha ng balanse sa pagitan ng pagganap, presyo at bilis. Salamat sa pagpapasimple ng arkitektura, naging mas maliit ang Barts sa laki at mas simple sa istraktura, at ang pagganap nito ay nagpapahintulot na maiuri lamang ito sa mababang klase ng mga video card mula sa AMD. Para sa mga empleyado ng estado na ang mga video card na may kapasidad ng memorya ng 1 GB AMD Radeon HD 6800 Series ay kasama. Ang kanilang mga katangian ay ang mga sumusunod:

  1. Sinusuportahan ang DirectX 11 at 5 shaders.
  2. Ang kapasidad ng memorya sa parehong mga modelo sa serye ay 1 GB.
  3. Mga frequency ng HD6850 at HD6870 GPU: 775 MHz at 900 MHz, ayon sa pagkakabanggit.
  4. Memory operating frequency ng HD6850 at HD6870: 1000 MHz at 1050 MHz, ayon sa pagkakabanggit.
  5. Lapad ng memory bus: 256 Bits para sa parehong mga modelo.

Sa oras ng kanilang pagpapakilala, ang mga card ay nagkakahalaga ng $180 at $240 para sa 6850 at 6870 na mga modelo, ayon sa pagkakabanggit. Ngayon ang mga video card na ito ay hindi ginawa, kaya ang kanilang gastos ay mas mababa. At maaari mo lamang bilhin ang mga chips na ito nang segunda mano.

Mga pagkakaiba sa pagitan ng HD6850 at HD6870

Sa linyang ito, ang modelong AMD Radeon HD6850 ang pinakabata. Narito ang mga spec kumpara sa mataas na card putulin. Bukod dito, ang lahat dito ay mas mahina, kasama na ang sistema ng paglamig. Isinasaalang-alang ang mas mababang pagganap at mahinang sistema ng paglamig, ang temperatura ng AMD Radeon HD 6800 Series sa ilalim ng pagkarga, lalo na ang modelong HD6850, ay nananatiling pareho. At ito ay isang malinaw na disbentaha ng modelong ito.

Kung ihahambing natin ang resulta ng pagsubok sa chip na ito sa programa ng 3DMark na may HD6870 chip, kung gayon ang resulta ng huli ay magiging 2-3 libong puntos na mas mataas. Ang pagkakaiba ng FPS sa mga demanding na laro tulad ng Crysis o Far Cry 2 ay magiging 10-15 FPS, at ito ay isang medyo malaking agwat. Kaya ang pagkakaiba ng presyo sa pagitan ng mga card na ito, na may average na $60.

Ang mas lumang modelo HD6870 ay isang karapat-dapat na katunggali sa punong barko ng oras na iyon - ang TOP video card HD5870. Ang bentahe ng solusyon na ito ay ang mababang presyo nito kumpara sa katunggali nito mula sa Nvidia at ang kakayahang gamitin ang DirectX11 nang buo. Gayunpaman, pag-uusapan natin ang mga resulta ng pagsubok sa card na ito at ang paghahambing nito sa katunggali nitong GTX 460 sa ibaba.

Mga kakumpitensya

Isinasaalang-alang ang presyo sa oras ng paglabas at ang mga katangian, ang mga pangunahing kakumpitensya ng linya ay maaaring isipin bilang mga modelo mula sa Nvidia - ito ang mga GTX460 at GTX470 video card. Ang kanilang mga pagtutukoy ay bahagyang mas mahusay kumpara sa mga modelo ng AMD. Halimbawa, ang GTX460 at GTX470 ay may mga core na gumagana sa 675 at 607 MHz ayon sa pagkakabanggit, ngunit mas mataas ang memory clock - 1800 MHz para sa GTX460 at 1674 MHz para sa GTX470. Pero pangunahing tampok Ang modelong GTX470 ay nasa memory bus width - 320-bit GDDR 5, na naglalagay sa video card na ito sa ulo at balikat sa itaas ng mapagkumpitensyang modelo mula sa AMD na may 256-bit na lapad ng bus. Gayunpaman, ang pagkakaiba sa pagganap ay minimal. Ito ay hindi direktang nagpapatunay sa mahusay na pag-optimize ng mga bahagi ng AMD video card at magandang software para dito.

Pagsubok sa AMD Radeon HD 6800 Series 1024 MB video card

Ang sumusunod na hardware ay ginamit para sa pagsubok:

  1. CPU Core i7 3.3 GHz.
  2. 6 GB ng RAM.
  3. Windows 7 64-bit na OS.

Sa unang laro na sinubukan namin, Battlefield Bad Company 2, ang solusyon ng AMD ay naging mas mahusay. Ang HD 6800 video card ay nakakuha ng 30 FPS sa maximum na mga setting ng graphics, habang ang GeForce 460 card ay nagpakita ng resulta ng 22 FPS lamang. At kung ang 30 FPS ay matatawag pa ring "mapaglaro" na resulta, pagkatapos ay sa 22 mga frame bawat segundo ay hindi ka na makakapaglaro nang kumportable.

Gayunpaman, sa larong Aliens vs. Predator ang sitwasyon ay nagtrabaho sa pabor ng GeForce. Dito ang mga graphics mula sa GeForce ay nagpakita ng 30 FPS sa pinakamataas na resolution. At kapag sinusubukan ang laro sa isang AMD HD6800 video card, ang resolution ay kailangang bawasan sa 1600x900 upang makakuha ng parehong 30 FPS.

Ang medyo hinihingi na larong Crysis Warhead ay tumatakbo sa parehong card sa mababang resolution ng screen. Ang pagsubok sa mga laro ay nagbibigay lamang ng hindi direktang pag-unawa kung aling video card ang mas mahusay. Walang malinaw na nagwagi dito, at ang parehong mga modelo ay karapat-dapat na mga pagpipilian. Totoo, ang solusyon mula sa Nvidia ay nagkakahalaga ng kaunti pa. Sa anumang kaso, ang mga katangian ng AMD Radeon HD 6800 Series ay nagbibigay-daan sa iyo na magpatakbo ng mga laro na inilabas noong 2010-2013 sa mga setting ng mataas na graphics. Ngunit ang mga modernong bagong video card ng linyang ito ay hindi makayanan.

Mga disadvantages ng linya

Ang halatang kawalan ng parehong mga board ay ang operating ingay, na nauugnay sa isang hindi sapat na mahusay na sistema ng paglamig. Pagkatapos ng lahat, madaling gawin ang fan na paikutin nang buong lakas. Ito ay nagpapahintulot sa amin na tapusin na ang mga developer ay hindi nagbigay ng sapat na pansin sa sistema ng paglamig, dahil kapag ang parehong mga chips ay mabigat na na-load, ang fan ay gumagawa ng maraming ingay at halos hindi makayanan ang pag-alis ng init. Kasabay nito, hindi mo nais na ganap na i-load ang chip, at kapag ang user ay nakarinig ng ugong mula sa system unit, intuitively niyang sinusubukang i-reset ang mga setting ng graphics sa isang katanggap-tanggap na antas.

Konklusyon

Ang bagong linya ng HD 6800 Series ay naging karapat-dapat at kontrobersyal sa panahon nito. Ang parehong mga video card ay matagumpay na nakapasok sa merkado at nakatanggap ng mga positibong pagsusuri, dahil sinakop nila ang mga niches sa pagitan ng mga flagship chips at murang mga video card. Kung ikukumpara sa mas mahal na mga solusyon mula sa Nvidia, ang mga sample mula sa AMD ay mukhang mas mahusay, na maaaring ipaliwanag ang pagtaas ng kanilang katanyagan. At, siyempre, bumababa ito sa presyo. Ito ay nagkakahalaga ng pagkilala na ginawa ng AMD ang pinakamahusay na desisyon upang matiyak na ang presyo at pagganap ng kanilang mga produkto ay tumutugma.

Isinasaalang-alang hindi ang pinaka mas magandang sistema paglamig, mas mahusay din na kalimutan ang tungkol sa posibleng overclocking ng mga chips na ito. Pagkatapos ng lahat, kahit na sa peak load ay mahirap para sa fan na alisin ang init. Gayunpaman, para sa mga eksperimento na may overclocking, pinakamahusay na gumamit ng mga chips mula sa Nvidia - sila ay halos palaging mas tahimik at mas malamig.

Sa una, ang serye ng Radeon 6900 ay nakatuon sa isang 32nm na teknolohiya ng proseso, ngunit ang mga problema sa TSMC ay pinilit silang iwanan ang mga plano para sa 32nm at lumipat sa 40nm.

Ang mga chip ng Cayman ay naglalaman ng 2.64 bilyong transistor na matatagpuan sa isang lugar na 389 sq. mm. Bahagi ng dahilan para sa mas malaking laki ng chip ay ang bagong ikawalong henerasyong tessellator, na magpapahusay sa pagganap ng DirectX 11.

Ang mga bagong anti-aliasing mode ay naidagdag - Morphological Anti-Aliasing (MAA) at Enhanced Quality Anti-Aliasing (EQAA).

Ang malaking pagkakaiba sa pagitan ng serye ng 6900 at ng mga nauna nito ay ang TDP ng mga card na ito ay maaaring limitado gamit ang AMD PowerTune na teknolohiya, at hindi sa pamamagitan ng paglilimita sa mga frequency, tulad ng dati. Ang card engine at memory ay dynamic na aayusin sa limitasyon ng TDP ng bawat partikular na card. Kaya, para sa Radeon HD 6970 ang maximum na TDP ay nasa 250W, habang ang TDP ng mas mahinang Radeon HD 6950 ay limitado sa 200W.

Ang pagkonsumo ng parehong mga card sa rest mode ay medyo maliit - 20W lamang. Kasabay nito, para sa power supply ang Radeon HD 6950 ay nangangailangan ng isang pares ng 6-pin connector, habang ang HD 6970 ay papaganahin ng isang 8-pin connector at isa pang 6-pin.

Ang mga card ay nakatanggap din ng isang espesyal na BIOS hardware reset, na magpapahintulot sa iyo na i-reset ang BIOS sa mga default na setting kung sakaling magkaroon ng mga problema sa mga setting.

Ang Vapor Chamber Cooling ay medyo lumang cooling system, ngunit ito ang ginamit ng AMD para sa lahat ng reference card nito, na malamang na susundin ng marami sa mga kasosyo nito. Ang mga vapor chamber cooler ay mas mahusay kaysa sa tradisyonal na mga heat pipe. Bilang karagdagan, mas madali silang magdisenyo. Sa pamamagitan ng paraan, ang NVIDIA card GeForce GTX Gumagamit din ang 580 ng Vapor Chamber Cooling.

Ang parehong mga card ay may 2 DVI slot, isang HDMI 1.4a slot at isang pares ng mini-DisplayPorts. Sa una, maaaring suportahan ng mga card ang hanggang apat na monitor, habang ang suporta para sa anim na monitor ay ibinibigay gamit ang DisplayPort hub.

Ang mga bagong card ay idinisenyo upang alisin ang Radeon HD 5800 series, isa sa pinakamatagumpay na serye ng mga video card sa kasaysayan ng AMD, mula sa merkado. Ito ang unang serye mula sa AMD na nakatanggap ng suporta para sa DirectX 11, gayunpaman, ito ay itinuturing na mahal para sa produksyon at itinigil.

Ang kamakailang inilabas na serye ng Radeon HD 6700 ay nag-aalok ng katulad na pagganap sa 5800, ngunit mas mura ang halaga. Kung ikukumpara sa Radeon HD 5870, ang Radeon HD 6970 ay magbibigay ng 20% ​​na mas maraming performance at nagkakahalaga ng $20.

Ipaalala ko sa iyo na ang Radeon HD 6990 card, na may codenamed Antilles, ay ilalabas sa susunod na buwan. Ayon sa mga inaasahan, ang dual-core na bersyon ng Radeon HD 6970 ay makakatanggap ng 4GB ng GDDR5 memory.

Ang taunang pag-update ng AMD at NVIDIA graphics architecture noong 2010 ay naging hindi katulad ng dati: sa halip na isang radikal na pag-update ng mga video card at ang pamilyar na. matangkad pagganap, ang parehong mga kumpanya ay nagpasya na bigyang-pansin ang mga umiiral na GPU, pag-optimize at pag-finalize ng mga ito upang maalis ang mga pangunahing pagkukulang at bawasan ang gastos ng mga huling video card. Sa partikular, mahirap sabihin tungkol sa mga ipinakita nang mas maaga na nagtakda sila ng isang bagong bar ng pagganap - sa halip, dinadala nila ang mga kakayahan na nakamit ng nakaraang henerasyon sa middle-end na segment, na siyang pinakalat.

Gayunpaman, ang interes sa mga produktong mahilig sa high-end ay patuloy na nagpapatuloy, at ang parehong mga vendor ay kailangang magtrabaho nang husto upang masiyahan ang hinihinging kategorya ng mga mamimili. Tiningnan na namin ang bagong pagkakatawang-tao ng mga nangungunang video card ng kumpanya sa binagong arkitektura ng Fermi, at ngayon ay sa wakas ay oras na para sa tugon ng AMD - mga accelerators Radeon HD 6900 batay sa Cayman chips.

Dahil sa bahagyang pagbuti ng mga Barts core (Radeon HD 6800) kumpara sa Cypress (Radeon HD 5800), ang tanong kung paano plano ng AMD na pataasin ang performance ng mga top-end na GPU sa hinaharap ay napakatindi: walang partikular na mga kinakailangan para sa isang radikal na pagbabago sa arkitektura. Gayunpaman, nagawa pa rin kaming sorpresahin ng kumpanya: ang Cayman ay lubhang naiiba sa mga nauna nito.

Bago sa AMD Cayman: mula VLIW5 hanggang VLIW4

Ang mga bagong AMD GPU ay na-upgrade mula sa VLIW5 (Very Large Instruction Word) architecture sa VLIW4. Ipaliwanag natin: para sa ilang henerasyon ng mga GPU mula sa vendor na ito, ang mga ito ay ginawa mula sa mga processor (SIMD Engines), na nahahati sa limang execution unit: apat na magkaparehong ALU na nagsasagawa ng mga floating-point na kalkulasyon na may 32-bit na katumpakan, at isang karagdagang Ang "mas matalinong" T-unit na may kakayahang magsagawa rin ng mga transendental na tagubilin (mga pag-andar sa matematika ng tangent, arctangent, cosine, exponentiation at subtraction, atbp.). Ang NVIDIA ay may mga katulad na device sa Fermi architecture, na tinatawag na Special Function Units. Ang nuance ng solusyon na ito ay para sa pinakamainam na pagpapatupad ng code sa pamamagitan ng mga bloke na ito, kinakailangan na maingat na i-debug ito at ayusin ito sa isang espesyal na paraan, kung hindi man ay uupo lamang sila, at ang pagpapatupad ay ganap na isasagawa ng mga ordinaryong ALU. Ang prinsipyo ng parallelization ng code execution sa AMD architectures ay batay sa mga tagubilin (Instruction Level Parellelism): limang ALU sa loob ng isang SIMD processor ay maaaring sabay na magsagawa ng limang magkakaparehong tagubilin, na hindi gaanong karaniwan sa loob ng isang thread.

SIMD processor na may VLIW4 architecture
Eskematiko ng Cayman GPU
Mga na-optimize na mekanismo ng memorya

Ayon sa AMD, sa karamihan ng mga kaso, ang mga ALU ay talagang idle (average na load - 3.4 out of 5), kaya ang desisyon ay ginawa upang alisin ang mga hindi gaanong ginagamit na T-block, sa halip ay dagdagan ang bilang ng mga processor sa kabuuan. . Kaya, ngayon ang GPU ay binuo mula sa mga processor ng SIMD, na binubuo ng apat na magkaparehong regular na ALU, at kung kailangan pa ring magsagawa ng isang kumplikadong pagtuturo, tatlo sa kanila ay halos pinagsama at ginagawa ito sa isang ikot ng orasan. Ginamit lang ng mga developer ang nabakanteng espasyo upang madagdagan ang bilang ng mga processor: sa halip na 20, mayroon na ngayong 24 ang Cypress.

Ang pamamaraang ito ay may parehong mga pakinabang at disadvantages. Ang pangunahing "plus" ng paglipat sa VLIW4 ay ang mas mahusay na kontrol sa pag-load ng GPU: ang tradisyonal na pag-render ay perpektong parallelize, at ang isang mas malaking bilang ng magkaparehong mga yunit ng pagpapatupad ay magiging mas kumikita kaysa sa pagkakaroon ng kung minsan ay "matalino". Ang downside ay ang mga shader na naka-optimize sa ALU na matatagpuan sa ilang mga laro ay maaaring tumakbo nang mas mabagal sa Cayman kaysa sa Cypress. Bukod pa rito, para sa mga layunin ng GPGPU—isa pang pangunahing bahagi na parehong binibigyang pansin ng AMD at NVIDIA—ang kakayahang mabilis na magsagawa ng mga kumplikadong tagubilin ay lubos na mahalaga. Gayunpaman, para sa AMD graphics division, ang mga gaming video card ang pangunahing priyoridad, kaya naman ginawa ang desisyong ito. Bilang karagdagan, ang inilalarawan sa itaas na kakayahang magsagawa ng maraming mga thread nang sabay-sabay at mas malaking bilang ng mga SIMD processor ay maaaring maging mas kapaki-pakinabang na GPU para sa mga pangangailangan ng GPGPU kaysa sa Cypress at Barts.

Pagbabalik sa mga pagbabago sa GPU, tandaan din namin na kasama na ngayon ang isang pinahusay na tagapamahala ng thread, na ngayon ay may kakayahang magsilbi sa ilang mga executable na "core" nang sabay-sabay. Ang NVIDIA Fermi ay mayroon ding ganitong kakayahan, ngunit may mga limitasyon: bagama't ang GPU ay may kakayahang magsagawa ng mga kalkulasyon sa maraming mga core nang sabay-sabay, dapat silang lahat ay nabuo ng parehong application sa loob ng parehong konteksto ng GPU (estado). Kung ang dalawang core mula sa magkaibang mga application ay inilunsad para sa pagproseso (halimbawa, GPGPU video rendering nang sabay-sabay sa Direct3D), ang video card ay kailangang patuloy na lumipat sa pagitan ng mga konteksto, na binibigyang pansin ang isang core o isa pa (at hindi sabay-sabay), at ito ay nangangailangan ng malaking pagganap pagkalugi . Ang AMD Cayman ay gumagamit ng ibang diskarte: ang driver ay nag-virtualize ng GPU para sa bawat executable core, upang wala sa mga application na gumagamit nito ang nakakaalam lamang tungkol sa pagkakaroon ng iba, na parang nagtatrabaho sa sarili nitong processor at sarili nitong virtual memory. Ang driver ay nagpapadala ng command queue sa graphics processor, at ang asynchronous thread manager na matatagpuan sa mga proseso ng GPU at muling inaayos ang instruction queue sa paraang ang mga pagkalugi mula sa pagpapatupad ng mga heterogenous na thread ay minimal. Ang tanging "ngunit": ang GPU hardware ay may ganoong mga kakayahan, ngunit wala pang software API na sumusuporta sa pagbabagong ito (DirectCompute sa kasalukuyang rebisyon ay hindi naglalaman nito, at ang AMD ay inilalagay ang lahat ng pag-asa nito sa OpenCL).

Kabilang din sa mga pagpapabuti sa bahagi ng pag-compute ng GPU, napapansin namin ang pag-optimize ng mga interface ng memorya: ang bawat SIMD processor ay naglalaman ng 8 KB ng eksklusibong L1 cache at 32 KB ng lokal na buffer, ang core ay nilagyan ng apat na 128 KB L2 cache array at isang 64 KB na pandaigdigang buffer. Ang pag-sample ng data at pagsusulat mula sa lokal na buffer hanggang sa pandaigdigang buffer ay maaaring gawin nang mabilis, nang hindi iniiwan ang GPU sa memorya ng video card. Ang pagpapakilala ng pangalawang DMA block sa memory controller ay nagpapabilis din ng data exchange dito.

Ang mga rasterizer ay makabuluhang napabuti: ngayon ang pagpoproseso ng 16-bit na data ay dalawang beses nang mas mabilis, ang 32-bit na data ay 2-4 na beses na mas mabilis, depende sa uri ng data.

Dalawang beses ang Geometry

Ang isa sa mga mahinang punto ng mga nakaraang henerasyon ng mga AMD GPU ay mababa ang pagganap kapag nagpoproseso ng geometry, lalo na, ang mas mababang pagganap sa panahon ng tessellation kaysa sa NVIDIA Fermi. Pinahusay ng AMD ang Cayman sa pagpapakilala ng pangalawang Graphics Engine: ngayon ang vertex at geometry assembly, tessellation at rasterization ay isinasagawa sa dalawang thread. Bilang karagdagan, ang 8th generation tessellator mismo ay gumagana nang 2-3 beses na mas mabilis kaysa sa dati nitong pagkakatawang-tao sa Cypress. Ang resultang net performance gain mula sa pagtaas ng geometry processing speed ay 30-70%, depende sa kung gaano kalaki ang paglo-load ng naprosesong eksena sa mga tessellator.

Paano gumagana ang EQAA

Sa Cayman, ipinakilala ng AMD ang suporta para sa isang bagong algorithm ng pag-smoothing ng imahe: Enhanced Quality Anti-Aliasing (EQAA). Sa ilalim ng pangalang ito ay walang iba kundi isang pamilyar na pangalan mula noong mga araw ng NVIDIA G80 Coverage Sample Anti-Aliasing - isang algorithm na gumagamit ng impormasyon tungkol sa mga primitive sa halip na ganap na kulay at depth na mga sample upang mapabuti ang kalidad ng anti-aliasing. Kung ang isang pixel ay matatagpuan sa hangganan ng dalawang primitives (nagpapatong ng mga ito), ang kulay nito ay naa-average hindi lamang sa buong RGB+Z na mga sample, kundi pati na rin sa mga karagdagang napiling kulay lamang. Sa isip, ang kalidad ng antialiasing ay dapat na katumbas ng naabot sa mas mataas na antas ng multisampling (4xEQAA = 8xMSAA) na may napakaliit na parusa sa pagganap, dahil Mas kaunting memorya ang ginugugol sa mga karagdagang sample na ito. Bilang karagdagan, sinusuportahan din ng Cayman ang Morphological Anti-Aliasing, isang simpleng diskarteng anti-aliasing na ipinakilala sa Radeon HD 6800 sa pamamagitan ng pagtukoy ng mga contrast area gamit ang isang post-processing filter.

PowerTune

Tulad ng NVIDIA, seryosong nababahala ang AMD tungkol sa problema sa paggamit ng kuryente ng mga video card nito sa ilalim ng mataas na pagkarga, kapag ang mga device ay kadalasang lumampas sa kanilang nakasaad na TDP. Alalahanin natin na ang NVIDIA GeForce GTX 570/580 ay may kasamang mga yunit ng pagsubaybay para sa kasalukuyang natupok ng mga video card, na, kapag nakita ang isang tumaas na load at nakita ng driver na tumatakbo ang mga application para sa stress testing (FurMark, OCCT), bawasan ang mga frequency ng kalahati . Ang AMD ay lumampas sa katunggali nito sa pamamagitan ng pagpapakilala ng teknolohiyang PowerTune. Ang mga yunit na binuo sa GPU ay patuloy na sinusuri ang antas ng enerhiya na natupok nito, at kung ang TDP ay lumampas, ang driver "on the fly" ay bahagyang binabawasan ang bilis ng orasan (hindi sa kalahati, tulad ng sa GeForce GTX 580/570, ngunit ng humigit-kumulang 10%). Sa katunayan, mayroon kaming kumpletong analogue ng Intel Turbo Boost, tanging ito ay gumagana sa diametrically kabaligtaran. Alinsunod dito, ang parameter ng TDP na idineklara ng AMD ay dapat na ituring na hindi ang ganap na maximum, ngunit ang maximum na pinapayagan. Ang desisyon na ito ay ganap na lohikal: sa halip na itakda ang mga frequency ng orasan ng mga video card na halatang mas mababa kaysa sa mga posibleng maabot ng isang partikular na GPU upang magarantiya ang proteksyon nito mula sa sobrang init at pinsala sa kaganapan ng pinakamataas na posibleng pagkarga, ang AMD ay maaari na ngayong magtakda ng mas mataas paunang dalas, dahil gayon pa man, kadalasan ang GPU ay hindi ganap na na-load at hindi kumonsumo ng maximum na kasalukuyang. Kung biglang nangyari ito, inaayos lang ng driver ang dalas, pinapanatili ang video card sa loob ng TDP.

Maaaring i-adjust ang PowerTune sa Overdrive panel ng Catalyst Control Center utility, na may mga value na mula -20% hanggang +20%. Tulad ng madaling maunawaan, ito ay kung paano inaayos ang threshold ng tugon ng algorithm. Tandaan na sa normal na mode, ang PowerTune ay napakabihirang gumagana at nakakaapekto sa pagganap sa karamihan ng mga application nang napakakaunti - sa loob ng 1-2 frame/s. Imposibleng ganap na hindi paganahin ang system na ito, gayunpaman, malinaw naman, ang mga tagagawa ng third-party na video card ay magagawang baguhin ang threshold para sa pag-activate nito para sa kanilang mga pre-overclocked na modelo, ngunit hindi pa rin malinaw kung ano ang dapat gawin ng mga tagasuporta ng matinding overclocking.

Pagkilala sa AMD Radeon HD 6900

Kaya, tingnan natin ang mga video card na ipinakita ng AMD. Kasama sa pamilyang Cayman ang dalawang modelo - Radeon HD 6970 At Radeon HD 6950. Ang mga ito ay nakaposisyon na medyo kawili-wili: ang nangungunang pagbabago ay matatagpuan sa pagitan ng NVIDIA GeForce GTX 580 at GTX 570, at ang nakababata ay sumasakop sa sarili nitong angkop na lugar sa pagitan ng GeForce GTX 570 (itaas) at isang pares ng Radeon HD 6870 at GeForce GTX 470 (ibaba. ). Ang mga inirerekomendang presyo ay nakatakda sa $369 at $299, ayon sa pagkakabanggit. Ang nangungunang modelo sa linya ng AMD ay patuloy na Radeon HD 5970; ang hitsura ng kahalili nito, ang HD 6990 batay sa dalawang Cayman GPU, ay dapat na asahan lamang sa unang quarter ng 2011.

Cayman XT GPU AMD Radeon HD 6970 naglalaman ng 1536 aktibong ALU, na nakapangkat sa 24 na SIMD array ng 16 na SIMD processor, 96 na texture unit at 32 rasterizer. Ang dalas ng orasan ay 880 MHz. Ang video card ay nilagyan ng 2 GB ng GDDR5 memory na may clock frequency na 1375 MHz (5500 MHz QDR), na naa-access sa pamamagitan ng 256-bit wide bus. Ang antas ng TDP ng single-chip na flagship na ito ay 250 W - 62 W na mas mataas kaysa sa Radeon HD 5870, at 100 W na mas mataas kaysa sa nakasaad na Radeon HD 6870.

Ang mas batang pagbabago ay nilagyan ng Cayman Pro GPU, kung saan 22 SIMD arrays ang aktibo, na umaabot sa 1408 ALU at 88 texture unit, ang bilang ng mga rasterizer ay nananatiling pareho - 32. Ang processor ay gumagana sa dalas ng 800 MHz, 2 GB ng memorya ng GDDR5 - sa 1250 MHz (5000 MHz QDR ), pinapanatili din ang lapad ng bus sa 256 bits. TDP AMD Radeon HD 6950 nakatakda sa 200 W. Kapag idle sa mas mababang frequency, ang parehong video card ay kumokonsumo ng 20 W.

Ang parehong mga pagbabago ay gumagamit ng parehong disenyo ng naka-print na circuit board at sistema ng paglamig, kaya isasaalang-alang namin ang mga ito nang magkasama. Ang mga board ay 10.5” (26.7 cm) ang haba at mangangailangan ng maluwag na case. Ang hugis-parihaba na plastik na pambalot ay ganap na sumasakop sa buong video card; walang mga kasiyahan sa disenyo tulad ng natatanging disenyo ng mga butas ng air intake, tulad ng sa Radeon HD 5870. Ang sistema ng paglamig ay isang napakalaking radiator na ganap na sumasaklaw sa GPU at memory chips, ang base nito ay ang vapor chamber, na naging napakapopular sa mga developer ng CO. Ang radiator ay tinatangay ng isang tradisyunal na centrifugal fan, ang lahat ng mainit na hangin ay tinanggal sa labas ng case. Tandaan na, hindi tulad ng NVIDIA, hindi sinubukan ng AMD na magkasya ang lahat ng mga video output sa isang gilid ng mounting strip at ibigay ang kalahati sa ventilation grille: dito ito ay tumatagal lamang ng isang-kapat ng strip. Ang kahusayan ng coolant ay sapat na: ang bilis ng control algorithm ay na-configure sa paraang upang panatilihin ang temperatura ng GPU sa 88-90 °C, at hanggang pagkatapos ay ang cooler ay nananatiling halos hindi marinig. Nalalapat ito lalo na sa Radeon HD 6950: ang CO nito ay nakayanan ang paglamig nang walang anumang mga problema, ngunit ang mas lumang modelo ay hindi pa rin matatawag na tahimik sa maximum na pagkarga sa FurMark. Hiwalay, ito ay nagkakahalaga ng noting na ang algorithm ay malinaw na hindi isinasaalang-alang ang posibilidad ng pagtaas ng PowerTune response threshold: kung sa normal na mode ang cooler Radeon HD 6970 gumagana nang malakas, ngunit patuloy, pagkatapos kapag ang threshold ay tumaas ng 20%, ito ay magsisimulang patuloy na umikot pataas at bumagal, kasunod ng mga pagbabago sa temperatura at pag-trigger ng PowerTune. Ang tunog, nang naaayon, ay pumutok nang hindi kanais-nais.

Ang power supply para sa mga video card ay ibinibigay ng dalawang konektor, para sa Radeon HD 6970 ito ay isang 8-pin at isang 6-pin, para sa mas batang bersyon - dalawang 6-pin. Ang VRM ay isinaayos ayon sa isang 6+2 na pamamaraan; ang isang piezo speaker na naka-install sa board ay inilaan upang magpahiwatig ng kakulangan ng kapangyarihan o isang hindi konektadong konektor.

Ang mga graphic na interface ay kinakatawan ng dalawang DVI, ang isa ay gumagana sa Dual-Link mode, ang pangalawa - Single-Link, isang HDMI 1.4a at dalawang mini-DisplayPort 1.2. Pinag-uusapan natin ang tungkol sa mga tampok ng rebisyon ng DisplayPort na ito.

Sinusuportahan ng parehong video card ang mga array ng CrossfireX hanggang sa Quad Crossfire na may apat na video card. Malapit sa mga konektor para sa pagkonekta sa mga tulay ng CF makakakita ka ng hindi inaasahang switch na may dalawang posisyon. Sa katotohanan ay Radeon HD 6900 naglalaman ng dalawang BIOS chips, ang isa ay maaaring i-flash ng gumagamit, at ang pangalawa ay naka-lock at nagbibigay-daan sa iyo upang mag-boot na may garantisadong matatag na mga setting sa kaso ng mga problema. Posible na sa hinaharap posible na ayusin (o ganap na huwag paganahin) ang PowerTune sa pamamagitan ng pag-edit ng BIOS - kung gayon ang pagkakaroon ng naturang pag-iingat ay higit pa sa makatwiran.

Mula sa karagdagang pag-andar Radeon HD 6900 Hindi namin mai-highlight ang anumang bago, ang hanay ng mga teknolohiya ay pareho pa rin: panoramic na output ng mga 3D na imaheng Eyefinity, stereoscopic HD3D na teknolohiya, hardware playback at pagproseso ng MPEG-4/ASP, MPEG-4/AVC, MPEG-4/MVC, VC -1 ay suportado at MPEG-2 sa pamamagitan ng UVD3 engine.

Lumipat tayo sa pagsubok

Una sa lahat, bigyang-pansin natin ang Unigine Heaven test: ang mabigat na pagkarga sa mga tessellator na dati ay ginawa ang application na ito na isang tunay na trump card para sa NVIDIA Fermi. Tulad ng nakikita mo, ang mga pagpapahusay na ginawa ng AMD sa mga bagong GPU ay nagpapahintulot sa kanila na sa wakas ay makipagkumpitensya sa kanilang mga karibal: Radeon HD 6970 ay halos kapantay ng GeForce GTX 570, na walang 2 bloke ng tessellation, tulad ng sa Cayman, ngunit kasing dami ng 15. Binibigyang-diin namin na sa kasong ito hindi namin masasabi na ang Cayman ay mas mabilis kaysa sa Fermi sa tessellation: ito ay nasa application na ito ng pagsubok na may mga coefficient na ginagamit nito na ang dalawang yunit ng ikawalong henerasyon ay sapat para sa pagkakapare-pareho sa GeForce GTX 570/580. Sa pangkalahatan, ang geometric na kapangyarihan ng NVIDIA video card ay mas mataas. Tulad ng para sa paghahambing ng mga henerasyon ng mga arkitektura ng ATI/AMD, kitang-kita ang pag-unlad: kahusayan Radeon HD 6950 higit sa Cypress sa anyo ng Radeon HD 5870 ay 36%.

Sa paglipat sa kumplikado at mga pagsubok sa paglalaro, nahaharap tayo sa isang medyo magkasalungat na sitwasyon. Ang parehong mga bersyon ng 3DMark na ginamit namin ay nagpapakita na Radeon HD 6970"nami-miss" ang nakatalagang niche nito sa pagitan ng GeForce GTX 580 at GTX 570, na nakaposisyon mismo sa ibaba ng mga ito. Sa parehong oras Radeon HD 6950 gumaganap nang eksakto tulad ng ipinangako, na nagbibigay ng kapansin-pansing lead sa GeForce GTX 470 at Radeon HD 6870.

Ang mga pagsubok sa laro ay nagpapakita na sa karamihan ng mga kaso AMD Radeon HD 6970 lumalabas pa rin na mas mabagal kaysa sa mga direktang kakumpitensya nito, at kung minsan ay kapansin-pansin: bigyang-pansin ang hindi magandang ipinaliwanag na kabiguan sa Dirt 2. Kami ay hilig na ipatungkol ang mga naturang resulta sa hindi sapat na pag-debug ng mga driver: ang isang makabuluhang pagbabago sa arkitektura ay malinaw na mangangailangan ng pag-optimize ng software para sa ang pinaka mahusay na trabaho. Malamang, sa changelogs ng mga susunod na bersyon ng Catalyst makikita natin ang maraming mensahe tungkol sa pagpapabuti ng performance ng Cayman sa ilang partikular na laro.

Tungkol sa Radeon HD 6950, kung gayon ang pagbabagong ito ay higit na kasiya-siya kaysa sa punong barko: dahil sa pagpoposisyon at presyo nito ngayon, wala itong mga kakumpitensya, at ang antas ng pagganap na ibinibigay nito ay higit pa sa sapat para sa karamihan ng mga modernong laro.

mga konklusyon

Sa pangkalahatan, ang mga bagong top-end na video card ng AMD ay maaaring walang alinlangan na ituring na isang bagong yugto sa ebolusyon ng graphics architecture ng kumpanya. Kung mula sa isang teknikal na punto ng view ang Radeon HD 6800 ay hindi mapasaya sa amin, bilang isang simpleng pagbabago ng mga umiiral na GPU, kung gayon Radeon HD 6900 talagang naglalaman ng seryosong muling idisenyo na mga processor. Ang isang mas malaking pagtuon sa pagganap sa mga average na kalkulasyon ay nagpapahintulot sa AMD na pataasin ang kapangyarihan ng mga core, at sa gayon ay mapabilis ang mga video card kumpara sa nakaraang henerasyon. Sa kasamaang palad, ang matinding pakikibaka sa NVIDIA para sa palad ay hindi nagtagumpay (ang GeForce GTX 580 ay masyadong mabilis), ngunit ang AMD ay mayroon pa ring tradisyonal na tramp card - isang posibleng pagbawas sa presyo. Totoo, kung sakali Radeon HD 6900 malamang na hindi ito agresibo tulad ng sa mga video card ng nakaraang henerasyon: ang Cayman GPU ay kapansin-pansing mas kumplikado, mas mataas ang gastos nito, at samakatuwid ang AMD ay may mas kaunting "puwang para sa pagmamaniobra."

Sa isang salita, ang rebolusyon ay hindi nangyari, at, hindi katulad ng 2009, sa pagkakataong ito ang AMD ay pumapasok sa bagong taon sa isang nakahahalina na posisyon. Well, para sa amin, bilang mga end consumer, ang ganitong kompetisyon ay nakikinabang lamang sa amin.

Ngayon, Disyembre 15, 2010, opisyal na ipinakita ang AMD Radeon HD 6900 series ng mga video card. Gaya ng ipinangako, ang pagtatanghal nito ay naganap wala pang isang buwan pagkatapos ng paglabas ng AMD Radeon HD 6800 series. Ang bagong single-chip leader na AMD Radeon Plano ng HD 6970 na palitan ang kamakailang inilabas na NVIDIA GeForce GTX 570, at kinakatawan ng AMD Radeon HD 6950 upang ipakita ang pinakamainam na solusyon sa mataas na pagganap.

Kaya, ang "alignment of forces" para sa ikaapat na quarter ng 2010 mula sa punto ng AMD ay dapat magmukhang ganito. Ang pinakaproduktibong video card ngayon ay mananatiling dual-chip video card na ATI Radeon HD 5970. Ang nakikipagkumpitensyang solusyon na NVIDIA GeForce GTX 580, na may pinakamataas na halaga at nailalarawan sa pinakamataas na pagkonsumo ng kuryente, ay dapat manatiling pinuno ng solong chip. Ngunit sa klase ng pinakamahusay sa mga tuntunin ng mga kakayahan sa presyo/GPU, dapat na matatagpuan ang AMD Radeon HD 6970. Ang mas mababang klase ay inookupahan ng mas batang modelo ng parehong serye, ang AMD Radeon HD 6950. Ang slide ay hindi nagpapahiwatig ng kung kanino eksaktong nakatakdang makipagkumpetensya, ngunit tila , sa mga tuntunin ng pagganap, ito ay nasa pagitan ng mga video card ng NVIDIA GeForce GTX 480 at NVIDIA GeForce GTX 470. Sa gitnang klase ng mga video card, ang lahat ay mananatiling hindi nagbabago: AMD Radeon HD 6800 video Ang mga accelerator ay dapat na matagumpay na makipagkumpitensya sa NVIDIA GeForce GTX 465, at ATI Radeon HD 5700 - sa NVIDIA GeForce GTS 450.

Ang mga Cayman graphics accelerators, pati na rin ang Cypress at Barts, ay ginawa gamit ang isang 40 nm na teknolohiyang proseso. Ang isa ay hindi maiiwasang magtanong: "Paano magiging mas mahusay ang mga bagong video accelerators?" Ang sagot sa tanong na ito ay maaaring maibigay nang mabilis, ngunit kakailanganin ng oras upang maibalangkas ang mga pangunahing punto ng "pag-optimize" sa core ng graphics.

Ang unang pinakakapansin-pansing pagbabago sa Cayman chips ay ang pagpapakilala ng isang na-convert na VLIW4 core architecture, sa halip na ang VLIW5 na karaniwan para sa Cypress at Barts GPUs. Ang kakanyahan nito ay upang bawasan ang bilang ng mga bloke sa isang superscalar stream processor mula lima hanggang apat. Ang ikalimang bloke ng mga espesyal na pag-andar, ang tinatawag na T-block, ay hindi kasama bilang hindi kinakailangan. Ang ganitong pagbabago sa arkitektura ay nagbibigay-daan sa amin na umasa para sa isang 10% na pagtaas sa pagganap sa bawat mm² ng chip.

Gayundin, sa AMD Radeon HD 6900 series graphics accelerators, ang uri ng panghuling mga bloke ng pag-render ng imahe, katulad ng mga bloke ng ROP, ay binago. Ang mga module ng Z/Stencil ROP ay pinagsama sa mga bloke ng Color ROP, na dapat na mapabilis ang mga operasyon ng pagsulat ng data.

Ang susunod na mahalagang pag-optimize ay ang pagpapakilala ng mekanismo ng "Asynchronous dispatch" para sa asynchronously executing commands, na nagbibigay-daan sa iyong mas mahusay na gamitin ang mga kakayahan ng GPU, na iniiwasan ang command congestion. Ang isa pang pagpapabuti ay ang dual DMA engine ay dapat pabilisin ang proseso ng pagbabasa at pagsulat ng data sa memorya.

Ang pagbuo ng GPU control logic ay naging doble rin, na ginagawang posible na iproseso ang dalawang primitives sa isang ikot ng orasan.

Ang dalawahang istraktura ng mga control unit at ang paggamit ng isang bagong tessellator ay dapat na may positibong epekto sa pagganap sa mga larong sumusuporta sa DirectX 11. Sa paghusga sa data ng AMD, kumpara sa ATI Radeon HD 5870, ang bagong AMD Radeon HD 6970 ay nasa karaniwan. 35% na mas produktibo.

Kasama ng bagong arkitektura, isang bagong anti-aliasing algorithm na may pinahusay na kalidad ang ipinakilala - Enhanced Quality Anti-Aliasing (EQAA). Nagtatampok ang bagong anti-aliasing mode ng hanggang 16 na tinantyang sample bawat pixel. Bukod dito, ang bilang ng mga kulay at mga sample ng pagsusuri ay maaaring ayusin nang nakapag-iisa. Ang isang positibong katotohanan ay ang mekanismong anti-aliasing ng EQAA na ito ay katugma sa mga adaptive na anti-aliasing na pamamaraan na Super-Sample AA at Morphological AA.

Ang isang side effect ng pagpapagana ng halos anumang uri ng anti-aliasing ay isang performance hit. Sa paghusga sa mga ibinigay na tagapagpahiwatig, ang pagganap pagkatapos na paganahin ang pinalawig na mode ng kalidad ay bahagyang bumababa, na dapat magbigay-daan sa iyo upang tamasahin ang isang mas mataas na kalidad na larawan na may parehong "playability".

Gayundin sa pagtatanghal ng AMD Radeon HD 6900 series na video card, nabanggit ang suporta para sa Morphological AA (MLAA) anti-aliasing mode, na tumutukoy sa post-filtering. Ang filtering mode na ito ay mas mabilis kaysa sa SSAA, na nagbibigay ng kapansin-pansing pagpapahusay sa kalidad ng imahe, at tugma sa DirectX 9, 10 at 11 na laro.

Isa sa mga pinakabagong inobasyon na ipinatupad sa AMD Radeon HD 6900 na serye ng mga video accelerator ay ang pag-optimize ng enerhiya - teknolohiya ng AMD PowerTune. Para sa napakalakas na video accelerators, ang isyu ng power supply ay karaniwang isa sa pinakamasakit. Samakatuwid, ang video card ay may mekanismo para sa paglilimita sa pagkonsumo ng kuryente kung ang mga halaga ng limitasyon ay lumampas. Partikular itong sinusubaybayan ng mga pinagsama-samang power control processor.

Maaaring kontrolin ang teknolohiya ng AMD PowerTune gamit ang AMD OverDrive sa AMD Catalyst Control Center upang mapataas o bawasan ang power range.

Ngayon ay lumipat tayo sa parehong kawili-wiling mga detalye ng detalye:

AMD Radeon HD 6870

AMD Radeon HD 6850

ATI Radeon HD 5870

ATI Radeon HD 5850

Codename

Cayman XT

Bilang ng mga transistor

2 , 6 4

2 , 6 4

Bilang ng mga stream processor

Pagganap, mga TFLOP

Mga bloke ng texture

Pag-filter ng texture, GTexels/s

Mga kulay na ROP

Pixel filtering, GPixels/s

Z/Stencil, GSamples/s

Core frequency, MHz

Dalas ng memorya, GHz

1,375 (5.5 effect-I) GDDR5

1,25 (5.0 effect-I) GDDR5

1.05 (4.2 effect-I) GDDR5

1.0 (4.0 effect-I) GDDR5

1.2 (4.8 effect-I) GDDR5

1.0 (4.0 effect-I) GDDR5

Lapad ng memory bus, mga bit

Bandwidth ng memorya, GB/s

Frame buffer, GB

Teknikal na proseso

TSMC 40 nm

TSMC 40 nm

Maximum/minimum na paggamit ng kuryente, W

Ang mas lumang modelo ng bagong serye ay mayroong 96 na texture unit at 24 na superscalar processor na tumatanggap ng 1536 ALU unit. Ang dating pinuno na ATI Radeon HD 5870 ay mayroon lamang 80 mga texture unit, ngunit mayroon itong mas maraming ALU unit - 1600. Dapat itong isaalang-alang na ito ay binuo sa VLIW5 architecture. Sa isang nakasaad na antas ng pagganap na 2.7 TFLOPs, ang AMD Radeon HD 6970 graphics accelerator ay halos katumbas ng ATI Radeon HD 5870, na mayroong 2.72 TFLOPs.

Ang core frequency ng AMD Radeon HD 6970 graphics processor ay 880 MHz. Gayundin sa detalye sa itaas, itinala ng tagagawa ang pagproseso ng dalawang primitive sa bawat siklo ng trabaho at ang pagkakaroon ng 128 Z/Stencil ROPs na mga bloke. Ang lapad ng memory bus ng AMD Radeon HD 6900 series na video accelerators, pati na rin ang AMD Radeon HD 6800 at ATI Radeon HD 5800, ay 256 bits. Ang "reference" na modelo ng video card ay nagbibigay para sa pag-install ng hanggang 2 GB ng GDDR5 video memory na may epektibong dalas 5500 MHz. Ang paggamit ng kuryente ng isang video card batay sa AMD Radeon HD 6970 ay dapat na mas mababa sa 300 W. Upang magbigay ng karagdagang kapangyarihan dito, binibigyan ito ng isang 8-pin at isang 6-pin na konektor ng PCIE.

Sa paghusga sa mga resulta ng pagsubok ng AMD, ang bagong video card na nakabatay sa AMD Radeon HD 6970 ay dapat na higitan ang katunggali nito na NVIDIA GeForce GTX 480 sa average na 15% sa lahat ng sikat na 3D na laro.

Bilang karagdagan, nabanggit na ang pagganap ng isang video card lamang batay sa AMD Radeon HD 6970 ay dapat sapat na upang i-play sa tatlong monitor gamit ang teknolohiyang AMD Eyefinity sa isang resolusyon na 5760x1080.

Ang paghahambing sa solong mode ng bago at nakaraang AMD flagship ay hindi ibinigay sa pagtatanghal, ngunit ito ay nabanggit na sa AMD CrossFireX mode, ang AMD Radeon HD 6970 accelerators ay magiging mas mabilis kaysa sa ATI Radeon HD 5870.

Ang pangalawang modelo ng bagong serye ay dapat na theoretically ay 17% mas mababa produktibo kaysa sa mas lumang mga solusyon batay sa AMD Radeon HD 6970. Ang AMD Radeon HD 6950 ay may 22 SIMD processors, na kung saan ang VLIW4 architecture ay nangangahulugan ng pagkakaroon ng 1408 ALU units. Ang dalas ng core ng graphics ay bahagyang mas mababa sa 800 MHz. Ngunit ang lapad ng bus at ang halaga ng GDDR5 video memory ay pareho para sa "reference" na modelo. Ngunit sa parehong oras, ang epektibong dalas ng memorya sa AMD Radeon HD 6950 video accelerator ay mas mababa - 5000 MHz, kumpara sa 5500 MHz.

Ang maximum na pagkonsumo ng kuryente ng AMD Radeon HD 6950 video card ay dapat na hindi hihigit sa 225 W, na tumutukoy sa pagkakaroon ng dalawang 6-pin PCIE power connectors lamang.

Batay sa internal performance testing, ang AMD Radeon HD 6950 ay 20% na mas mabilis kaysa sa NVIDIA GeForce GTX 470.

Ang isang pagbabago sa hardware sa serye ng mga video card ng AMD Radeon HD 6900 ay ang pagkakaroon ng switch sa pagitan ng dalawang BIOS chips. Ang isa sa mga BIOS chip ay maaaring muling isulat at i-update, habang ang pangalawa ay protektado mula sa pag-overwrit at nag-iimbak ng mga default na setting ng pabrika. Ang pagbabagong ito ay dapat talagang mag-apela sa mga mahilig.

Ang serye ng mga video card ng AMD Radeon HD 6900 ay may limang port para sa output ng imahe, na nagbibigay-daan sa iyong ikonekta ang anim na monitor sa isang video card nang sabay-sabay. Bukod dito, ang mga port, tulad ng sa kaso ng mga accelerator ng serye ng Barts, ay sumusunod sa mga bagong bersyon ng mga detalye ng DisplayPort 1.2 at HDMI 1.4a.

Sa pagtatanghal ng bagong serye ng AMD Radeon HD 6900 video card, marami ang nakatuon sa software support para sa lahat ng AMD Radeon video card - ang AMD Catalyst Software package. Pagkatapos ng lahat, isang mahalagang bahagi ng anumang produkto ng computer ay ang suporta sa software nito: mga driver, mga bahagi ng pagpapalawak, control panel. Ang AMD ay nagsusumikap din nang husto sa direksyon na ito, na naglalabas ng mga bagong bersyon ng mga driver para sa mga video card bawat buwan, na nag-o-optimize sa mga ito para sa mga modernong 3D na laro.

Naka-on sa sandaling ito Ang mga driver at management utility AMD Catalyst Control Center ay sumusuporta sa apat na operating system: Windows 7, Windows Vista, Windows XP at Linux. Bukod dito, ayon sa mga istatistika para sa 2010, higit sa 50 milyong hanay ng mga driver ng AMD Catalist ang na-download mula sa opisyal na website.

Ang isang malinaw na halimbawa ng pagiging epektibo ng pag-optimize ng driver ay ang pagganap ng mga ATI Radeon HD 5800 series na video card sa isang bilang ng mga sikat na laro kapag ina-update ang AMD Catalyst package mula sa bersyon 9.10 hanggang 10.10. Ang pinaka makabuluhang pagtaas ng pagganap ay naobserbahan sa larong Resident Evil 5, na 68%, sa larong Metro 2033 ang pagtaas ay 48%, at sa Dirt 2 - 43%. Ang isa pang anim na sikat na laro ay nakakita ng bahagyang mas maliit na mga pagpapabuti, na may average na 15%. Kasabay nito, ang listahan ng mga na-optimize ay nagsasama ng isang makabuluhang mas malaking bilang ng mga programa at laro, kung saan + 5-10% ng pagganap ay hindi rin magiging labis lamang salamat sa isang pag-update ng software. Bilang karagdagan, ang mga bagong bersyon ay nagwawasto ng mga error - ang system ay gumagana nang mas matatag, at ang "mga artifact" ay nawawala sa mga laro.

Kapansin-pansin na ang AMD ay lumilikha ng AMD Catalyst Application Profiles (CAPs) halos lingguhan, mga profile na partikular para sa pagpapataas ng kahusayan ng multi-video accelerator configuration o pag-optimize ng mga anti-aliasing mode sa mga bagong application.

Bilang karagdagan, binibigyang-diin ng AMD ang presensya sa AMD Catalyst package ng isang set ng DivX codecs para sa media encoding sa AMD Radeon HD 6800 at 6900 series graphics card, pati na rin ang suporta para sa bagong graphics API specification - OpenGL 4.1.

Ang isang maliit na anunsyo mula sa pagtatanghal ay na sa 2011 AMD Catalyst Control Center ay babaguhin ang interface nito sa isang mas madaling gamitin. Bago sa AMD Catalyst Control Center ay dalawang natatanging view para sa standard at advanced na control mode, pati na rin ang kakayahang mag-update ng mga driver para sa naka-install na AMD hardware.

Ngunit sapat na teorya - oras na upang magpatuloy sa pagsasanay.

Sa mga tuntunin ng kanilang disenyo, ang AMD Radeon HD 6970 at AMD Radeon HD 6950 video card ay halos magkapareho. At kung hindi para sa mga marka at inskripsiyon sa sistema ng paglamig, kung gayon sa unang sulyap ay hindi sila makikilala.

AMD Radeon HD 6970 Reference Design Graphics Card

Ang haba ng AMD Radeon HD 6900 series na video card mula cap hanggang tail ay 275 mm. Siyempre, hindi ito isang napakaikling video accelerator, ngunit hindi rin ito kasinghaba ng ATI Radeon HD 5870. Para sa klase ng mga video card nito, medyo katanggap-tanggap ang haba nito.

Ang video card ay may turbine-type cooler, na sumasakop sa dalawang expansion slot. Sa reverse side, ang video card ay natatakpan ng metal panel, na nagpapataas ng higpit at nagbibigay ng mas maaasahang pag-mount ng cooler.

Ang mismong disenyo ng AMD Radeon HD 6900 video card ay halos kapareho sa disenyo ng AMD Radeon HD 6800 series na video accelerators na may alternating red at black stripes. Ang mga karagdagang power connector, isang 8-pin at isang 6-pin, ay matatagpuan mula sa tuktok na bahagi na patayo sa textolite, na mas maginhawa kapag kumokonekta, lalo na sa mga kaso na hindi masyadong maluwang, kaysa sa posisyon ng mga konektor sa dulo .

Ang interface panel ng AMD Radeon HD 6900 graphics card ay may dalawang DVI-D port, dalawang DisplayPort 1.2 connectors at isang HDMI 1.4a.

Ang switch ng BIOS ay naroroon din sa parehong mga modelo ng mga video card sa seryeng ito sa itaas na bahagi sa tabi ng mga konektor ng CrossFire, na nagbibigay-daan sa iyong mag-assemble ng hanggang apat na katulad na card sa isang system.

Sa pamamagitan ng pag-alis ng back metal panel mula sa video card case, malalaman mo na kadalasang nagsisilbi itong higpit sa board. Walang mga elemento ng pag-init kung saan maaari itong mag-alis ng init, tulad ng mga memory chip o mga elemento ng power supply, sa reverse side.

Ang sistema ng paglamig para sa mga video card ay gawa sa tanso batay sa isang medyo malaking silid ng singaw, ang prinsipyo nito ay ginagamit din sa pinakabagong mga video card ng NVIDIA.

Ang layout ng naka-print na circuit board ay nagsasangkot ng lokasyon ng lahat ng pinakamainit na node sa harap na bahagi, na nagsisiguro ng kakayahang epektibong alisin ang init mula sa mga ito salamat sa pagkakaroon ng isang mataas na pagganap na palamigan.

Ang power regulator ng AMD Radeon HD 6970 video card ay may 6+2-phase na disenyo at kinokontrol ng VT1556MF PWM controller mula sa Volterra. Sa kaso ng mas lumang modelo ng serye, halos lahat ng mga upuan para sa mga elemento sa bahaging ito ng board ay inookupahan. Sa kaso ng hindi tamang koneksyon ng mga power connectors o ang kanilang kawalan sa lahat, mayroong isang built-in na speaker na malakas na nag-aabiso sa may-ari ng isang sitwasyong pang-emergency.

Ang GPU mismo ay ginawa nang walang takip sa pamamahagi ng init, kaya dapat kang maging maingat sa pag-install ng sistema ng paglamig. Ang GPU-Z utility ay hindi pa ganap na pamilyar sa bagong produkto, kaya ang ulat nito ay kailangang itama. Ang Radeon HD 6970 GPU ay naglalaman ng 1,536 ALU at 128 Z/Stencil ROP. Ang pangunahing dalas ng pagpapatakbo ay 880 MHz. Ang lapad ng memory bus ay 256 bits.

Ang reference card ay may 2 GB ng GDDR5 video memory na may walong Hynix H5GQ2H24MFR-R0C chips, na gumagana sa epektibong frequency na 5500 MHz. Gayunpaman, ang mga chip na ito ay may maliit na reserba ng bandwidth, dahil Sa isang boltahe ng supply na 1.6 V, sila, ayon sa pagtutukoy, ay nagbibigay ng isang epektibong dalas ng 6.0 GHz.

Sinubukan naming suriin kung gaano kahusay ang cooling system nito batay sa isang evaporation chamber na nakayanan ang paglamig ng AMD Radeon HD 6970 video card. Sa awtomatikong kontrol sa bilis ng turbine, ang matinding workload ay nagiging sanhi ng GPU na umabot sa isang kahanga-hangang 90°C. Ngunit ang cooler mismo sa mode na ito ay nagpapatakbo sa 40-45% ng kahusayan nito, kahit na ito ay hanggang sa 2500 rpm, na sinamahan ng isang bahagyang ngunit malinaw na naririnig na ingay.

Kung itatakda mo ang maximum na bilis ng pag-ikot ng turbine sa manual mode, ang temperatura ng GPU ay mabilis na bumababa ng halos isang ikatlo, ngunit ang cooler na umiikot sa bilis na higit sa 5600 rpm ay lumilikha ng hindi mabata na ingay. Kaya, ang sistema ng paglamig na ginamit ay may kakayahang palamigin ang video card, ngunit napakahirap tawaging tahimik - ang mga tagagawa ng mga alternatibong sistema ng paglamig ay dapat makinabang mula sa sitwasyong ito, at isang mamimili na gustong gumana nang mabilis ngunit tahimik ang video card sa ilalim ng anumang ang pagkarga ay dapat ihanda para sa mga karagdagang gastos.

Sa idle mode, ang pagkonsumo ng kuryente ng video card ay kapansin-pansing nabawasan dahil sa pag-optimize ng mga operating frequency at supply ng boltahe. Sa mode na ito, nananatiling tahimik ang card.

Overclocking AMD Radeon HD 6970

Tiyak na mapapabilis ng bawat may-ari ang mga video card batay sa AMD Radeon HD 6970 nang kaunti sa pamamagitan ng paggamit ng karaniwang tab ng AMD Catalyst Control Center - ATI Overdrive. Bukod dito, sa aming kaso, kahit na iniiwan ang mas malamig na kontrol sa lohika ng card at hindi gumagamit ng pagtatangka na i-optimize ang pagkonsumo ng kuryente, agad naming naabot ang karaniwang kisame na nakapaloob sa bahaging ito at tinitiyak ang ligtas na overclocking. Samakatuwid, upang subukang suriin ang potensyal ng dalas ng GPU at memorya ng video, ginamit namin ang utility ng MSI Afterburner 2.1.0 Beta 5.

Ang opisyal na sample na dumating sa amin ay nagawang gumana nang matatag sa dalas na 964 MHz para sa graphics processor at 1541 MHz (epektibong 6164 MHz) para sa memorya ng video, na 9.5% at 12% na mas mataas kaysa sa nominal na frequency, ayon sa pagkakabanggit, at ay magbibigay ng hindi bababa sa 10% na pagtaas sa pagganap sa mga laro, gayunpaman may dalawang beses sa antas ng ingay.

AMD Radeon HD 6950 Reference Design Graphics Card

Tulad ng nabanggit sa itaas, ang reference na AMD Radeon HD 6950 video card ay halos kapareho ng hitsura sa AMD Radeon HD 6970, at mula sa malayo maaari silang malito.

At ang AMD Radeon HD 6950 ay may turbine-type cooler, na sumasakop sa dalawang expansion slots. Sa reverse side, ang video card ay natatakpan din ng isang metal panel, na nagpapataas lamang ng higpit at nagbibigay ng mas maaasahang pangkabit ng sistema ng paglamig.

Ang tanging natatanging tampok ay ang inskripsyon sa mas malamig na pambalot at ang pagkakaroon ng dalawang 6-pin na karagdagang power connector, sa halip na isang 6-pin at 8-pin. Ang huli ay dahil sa bahagyang mas mababang pagkonsumo ng kuryente ng AMD Radeon HD 6950 - hanggang 225 W, sa halip na hanggang 300 W para sa mas lumang modelo.

Ang interface panel ay mayroon ding dalawang DVI-D port, dalawang DisplayPort 1.2 connector at isang HDMI 1.4a, kung saan maaari kang kumonekta ng hanggang anim na monitor sa kabuuan.

Parehong reference accelerators ng AMD Radeon HD 6900 series ay nailalarawan sa parehong mga cooling system at ganap na magkaparehong layout ng PCB, na ipinapalagay ang lokasyon ng lahat ng pinakamainit na node sa front side.

Ngunit sa mas batang modelo, dahil sa mas mababang pagkonsumo ng kuryente, ang power stabilizer ay may bahagyang pinasimple na hitsura, at upang magbigay ng karagdagang kapangyarihan, sa halip na isa sa mga 8-pin na konektor, isang 6-pin na konektor ang ginagamit.

Gayunpaman, ang pagpapasimple ay hindi nakakaapekto sa operating scheme - ang power stabilizer ng AMD Radeon HD 6950 video card ay mayroon pa ring 6+2-phase na disenyo at kinokontrol ng isang Volterra VT1556MF PWM controller.

Ito ay lubos na inaasahan na ang Radeon HD 6950 graphics processor ay may parehong hitsura tulad ng mas lumang solusyon, i.e. ginawa nang walang takip sa pamamahagi ng init. At sa AMD Radeon HD 6950, ang GPU-Z utility ay hindi pa ganap na pamilyar sa bagong produkto, kaya ang ilan sa mga katangian sa ulat nito ay hindi tumutugma sa mga nakasaad.

Ang Radeon HD 6950 graphics processor ay naglalaman ng 1408 ALU units, na pinagsama-sama sa 22 SIMD processors. Ang dalas ng pagpapatakbo ng AMD Radeon HD 6950 core ay 800 MHz, at nakikipag-ugnayan ito sa memorya ng video sa isang 256-bit na bus.

Ang reference card ay may 2 GB ng GDDR5 video memory, na nilagyan ng walong bahagyang mas mabagal na Hynix H5GQ2H24MFR-R2C chip na tumatakbo sa epektibong frequency na 5000 MHz. Ang mga chip na ito ay nagpapatakbo na sa nominal mode sa isang mas mababang boltahe ng supply kumpara sa mga chip sa Radeon HD 6970 - 1.5 V. Kaya, ang memorya ng video sa AMD Radeon HD 6950 ay may mas kaunting potensyal na overclocking.

At para sa Radeon HD 6950, nasuri ang pagganap ng isang karaniwang cooler. Kapag ang bilis ng pag-ikot ng turbine ay awtomatikong kinokontrol, ang matinding pagkarga ay nagiging sanhi ng pag-init ng GPU hanggang 84°C lamang. Kasabay nito, ang palamigan ay gumamit lamang ng 37% ng potensyal nito at nanatiling hindi masyadong maingay. Tulad ng nakikita mo, ang paggamit ng sistemang ito sa isang hindi gaanong mainit na card ay mas makatwiran.

Kapag manu-manong itinatakda ang maximum na bilis ng turbine, ang temperatura ng GPU ay bumababa ng 20°C, na lumilikha ng higit na kanais-nais na mga kondisyon para sa overclocking, halimbawa. Ngunit ang patuloy na pagtatrabaho sa isang turbine na umiikot sa bilis na higit sa 5600 rpm ay hindi magiging madali. Bilang karagdagan, sa kaso ng AMD Radeon HD 6950, ang reference cooling system ay mas mahusay na at pinapayagan ang accelerator na huwag mag-overheat nang walang kapansin-pansing ingay. Samakatuwid, ang pagpapalit nito ay kakailanganin lamang upang magsagawa ng mga eksperimento o, kung kinakailangan, upang ganap na patahimikin ang isang produktibong computer.

Sa idle mode, ang pagkonsumo ng kuryente ng AMD Radeon HD 6950 video card ay nababawasan sa pamamagitan ng pag-optimize ng mga operating frequency at supply ng boltahe. Sa mode na ito, ang card ay nananatiling halos tahimik.

Overclocking AMD Radeon HD 6950

Tulad ng sa kaso ng AMD Radeon HD 6970, ang AMD Radeon HD 6950 video card ay agad na na-overclock gamit ang AMD Catalyst Control Center sa limitasyon na itinakda sa tab na ATI Overdrive. Ang karagdagang overclocking ay isinagawa gamit ang MSI Afterburner 2.1.0 Beta 5 utility.

Nagawa naming makamit ang matatag na operasyon ng accelerator sa dalas na 873 MHz para sa graphics processor at 1456 MHz (epektibong 5824 MHz) para sa memorya ng video, na 9.1% at, sa hindi inaasahan, halos 16.5% na mas mataas kaysa sa nominal, ayon sa pagkakabanggit. Ang acceleration na ito ay dapat magbigay ng hindi bababa sa 10% na pagtaas sa performance sa mga laro.

Pagsubok

Upang subukan ang AMD Radeon HD 6970 at AMD Radeon HD 6950 video card, ang sumusunod na na-update na stand ay binuo:

CPU

Intel Core i7-980X Extreme Edition (LGA 1366, 6 core, 3.33 GHz, L3 12 MB) @4.1 GHz

Motherboard

MSI Big Bang-XPower (LGA 1366, Intel X58 Express, DDR3, ATX)

Cooler Master V8 (LGA 1366, 69.69 CFM, 2.94 mm H2O, 17-21 dB)

RAM

3x 2GB Kingston DDR3-2250 (KHX2250C9D3T1FK3/6GX)

Mga hard disk

2x 128 GB Kingston SSDNow V+ (SNVP325-S2B/128GB)

yunit ng kuryente

Pana-panahong M12D-850 (850 W, 120 mm, 20 dB)

Antec LanBoy Air Yellow (MidiTower, Transformer)

Sa kabila ng paggamit ng beta driver sa panahon ng pagsubok, ang mga bagong solusyon sa AMD - Radeon HD 6950 at Radeon HD 6970 - ay lubos na matagumpay na makikipagkumpitensya sa mga accelerator sa NVIDIA GPU sa maraming pagsubok at laro. Inaasahan namin na ang panghuling driver ay magbibigay ng mas mahusay na pagganap at katatagan, at makakatulong din na kahit papaano ay "pagtakpan" ang karamihan kahinaan mga accelerator mula sa AMD - mga application para sa OpenGL.

Panghuli, suriin natin ang kahusayan ng enerhiya ng mga bagong produkto.

Kung ikukumpara sa medyo mainit na 3D accelerator sa NVIDIA GeForce GTX 480, ang mga bagong produkto sa pangkalahatan ay maganda ang hitsura. Nagbibigay ng pareho o mas mahusay na pagganap sa maraming mga application, ang AMD Radeon HD 6970 graphics card ay may kapansin-pansing mas mababang pagkonsumo ng kuryente, kapwa sa ilalim ng pagkarga at sa idle.

mga konklusyon

Sa totoo lang, inaasahan namin ang higit pa mula sa paglabas ng Cayman graphics core at mga video card batay dito - AMD Radeon HD 6950 at AMD Radeon HD 6970. Ngunit, tulad ng ipinakita ng teorya at nakikita ng mga opisyal na slide, ang lahat ng ito ay nakumpirma ng pagsasanay, ang mga bagong single-chip na punong barko ay hindi nagbibigay ng isang husay na paglukso sa pagganap. Alinsunod dito, ang mga handang magbayad ng anumang presyo para sa pagganap ay dapat pa ring maghanap ng mga bihirang alok sa dual-chip Radeon HD 5970 o pumili ng mas karaniwang mga solusyon mula sa mga kakumpitensya sa NVIDIA GeForce GTX 580.

Ngunit, kung titingnan mo ang mga bagong produkto ngayon mula sa punto ng view ng presyo/mga tampok, pagkatapos ay salamat sa mas kaaya-ayang inirerekomendang gastos, $369 bawat card sa AMD Radeon HD 6970 at $299 bawat accelerator sa AMD Radeon HD 6950, ang mga solusyong ito ay dapat na tunay na mapagkumpitensya, lalo na sa background ng mas mabilis na mga accelerator na may ilang mga teknolohikal na pakinabang sa NVIDIA GeForce GTX 580 para sa $500 na inirerekomendang presyo at higit sa $600 na tunay na presyo.

Kasabay nito, huwag kalimutan na ang AMD Radeon HD 6950 at AMD Radeon HD 6970 graphics processor ay may na-optimize na arkitektura, salamat sa kung saan mayroon silang isang antas ng pagganap na sapat para sa halos lahat ng mga modernong laro na may pinakamainam na paggamit ng kuryente. At isinasaalang-alang ang lahat ng mga tampok na ito, kabilang ang pag-init at ingay, ang mga accelerator sa AMD Radeon HD 6950 na may reference na disenyo ay mukhang mas kanais-nais, bagaman pagkatapos ng ilang pag-optimize at pagpapalit ng cooler, ang AMD Radeon HD 6970 ay maaaring maging isang talagang kawili-wili. opsyon.

Nais naming ipahayag ang aming pasasalamat sa Ukrainian representative office ng AMD para sa pagbibigay ng mga video crates para sa pagsubok.

Nais naming pasalamatan ang Intel, MSI, Cooler Master, Kingston, Seasonic, Antec (distributor ng Eletek) at ASUS sa pagbibigay ng kagamitan para sa test bench.

Binasa ang artikulo nang 11112 beses

Mag-subscribe sa aming mga channel
Ibahagi