FastExcelReader 는 다음으로 구성된 FastExcelPhp 프로젝트의 일부입니다.
이 라이브러리는 가볍고 초고속으로 설계되었으며 최소한의 메모리 사용량이 필요합니다.
FastExcelReader는 XLSX 형식(Office 2007+)의 Excel 호환 스프레드시트를 읽을 수 있습니다. 데이터를 읽기만 하지만 매우 빠르고 최소한의 메모리 사용량으로 수행합니다.
특징
composer
사용하여 FastExcelReader를 프로젝트에 설치하십시오.
composer require avadim/fast-excel-reader
다음으로 이동:
/demo 폴더에서 더 많은 예제를 찾을 수 있습니다.
use avadim FastExcelReader Excel ;
$ file = __DIR__ . ' /files/demo-00-simple.xlsx ' ;
// Open XLSX-file
$ excel = Excel:: open ( $ file );
// Read all values as a flat array from current sheet
$ result = $ excel -> readCells ();
다음 배열을 얻게 됩니다.
Array
(
[A1] => 'col1'
[B1] => 'col2'
[A2] => 111
[B2] => 'aaa'
[A3] => 222
[B3] => 'bbb'
)
// Read all rows in two-dimensional array (ROW x COL)
$ result = $ excel -> readRows ();
다음 배열을 얻게 됩니다.
Array
(
[1] => Array
(
['A'] => 'col1'
['B'] => 'col2'
)
[2] => Array
(
['A'] => 111
['B'] => 'aaa'
)
[3] => Array
(
['A'] => 222
['B'] => 'bbb'
)
)
// Read all columns in two-dimensional array (COL x ROW)
$ result = $ excel -> readColumns ();
다음 배열을 얻게 됩니다.
Array
(
[A] => Array
(
[1] => 'col1'
[2] => 111
[3] => 222
)
[B] => Array
(
[1] => 'col2'
[2] => 'aaa'
[3] => 'bbb'
)
)
$ sheet = $ excel -> sheet ();
foreach ( $ sheet -> nextRow () as $ rowNum => $ rowData ) {
// $rowData is array ['A' => ..., 'B' => ...]
$ addr = ' C ' . $ rowNum ;
if ( $ sheet -> hasImage ( $ addr )) {
$ sheet -> saveImageTo ( $ addr , $ fullDirectoryPath );
}
// handling of $rowData here
// ...
}
// OR
foreach ( $ sheet -> nextRow () as $ rowNum => $ rowData ) {
// handling of $rowData here
// ...
// get image list from current row
$ imageList = $ sheet -> getImageListByRow ();
foreach ( $ imageList as $ imageInfo ) {
$ imageBlob = $ sheet -> getImageBlob ( $ imageInfo [ ' address ' ]);
}
}
// OR
foreach ( $ sheet -> nextRow ([ ' A ' => ' One ' , ' B ' => ' Two ' ], Excel:: KEYS_FIRST_ROW ) as $ rowNum => $ rowData ) {
// $rowData is array ['One' => ..., 'Two' => ...]
// ...
}
행별로 읽는 다른 방법
// Init internal read generator
$ sheet -> reset ([ ' A ' => ' One ' , ' B ' => ' Two ' ], Excel:: KEYS_FIRST_ROW );
// read the first row
$ rowData = $ sheet -> readNextRow ();
var_dump ( $ rowData );
// read the next 3 rows
for ( $ i = 0 ; $ i < 3 ; $ i ++) {
$ rowData = $ sheet -> readNextRow ();
var_dump ( $ rowData );
}
// Reset internal generator and read all rows
$ sheet -> reset ([ ' A ' => ' One ' , ' B ' => ' Two ' ], Excel:: KEYS_FIRST_ROW );
$ result = [];
while ( $ rowData = $ sheet -> readNextRow ()) {
$ result [] = $ rowData ;
}
var_dump ( $ result );
// Read rows and use the first row as column keys
$ result = $ excel -> readRows ( true );
다음과 같은 결과를 얻게 됩니다.
Array
(
[2] => Array
(
['col1'] => 111
['col2'] => 'aaa'
)
[3] => Array
(
['col1'] => 222
['col2'] => 'bbb'
)
)
선택적 두 번째 인수는 결과 배열 키를 지정합니다.
// Rows and cols start from zero
$ result = $ excel -> readRows ( false , Excel:: KEYS_ZERO_BASED );
다음과 같은 결과를 얻게 됩니다.
Array
(
[0] => Array
(
[0] => 'col1'
[1] => 'col2'
)
[1] => Array
(
[0] => 111
[1] => 'aaa'
)
[2] => Array
(
[0] => 222
[1] => 'bbb'
)
)
결과 모드에 허용되는 값
모드 옵션 | 설명 |
---|---|
키_원본 | '1'의 행, 'A'의 열(기본값) |
KEYS_ROW_ZERO_BASED | 0부터 행 |
KEYS_COL_ZERO_BASED | 0부터 열 |
KEYS_ZERO_BASED | 행은 0부터, 열은 0부터(KEYS_ROW_ZERO_BASED + KEYS_COL_ZERO_BASED와 동일) |
KEYS_ROW_ONE_BASED | 1부터 행 |
KEYS_COL_ONE_BASED | 1의 열 |
KEYS_ONE_BASED | 1의 행, 1의 열(KEYS_ROW_ONE_BASED + KEYS_COL_ONE_BASED와 동일) |
결과 모드와 결합할 수 있는 추가 옵션
옵션 | 설명 |
---|---|
KEYS_FIRST_ROW | 첫 번째 인수의 true 와 동일합니다. |
키_상대 | 영역의 왼쪽 상단 셀에서 색인(시트 아님) |
KEYS_SWAP | 행과 열 바꾸기 |
예를 들어
$ result = $ excel -> readRows ([ ' A ' => ' bee ' , ' B ' => ' honey ' ], Excel:: KEYS_FIRST_ROW | Excel:: KEYS_ROW_ZERO_BASED );
다음과 같은 결과를 얻게 됩니다.
Array
(
[0] => Array
(
[bee] => 111
[honey] => 'aaa'
)
[1] => Array
(
[bee] => 222
[honey] => 'bbb'
)
)
라이브러리는 이미 기본적으로 빈 셀과 빈 행을 건너뜁니다. 빈 셀은 아무것도 기록되지 않은 셀이고, 빈 행은 모든 셀이 비어 있는 행입니다. 셀에 빈 문자열이 포함되어 있으면 비어 있는 것으로 간주되지 않습니다. 하지만 이 동작을 변경하고 빈 문자열이 있는 셀을 건너뛸 수 있습니다.
$ sheet = $ excel -> sheet ();
// Skip empty cells and empty rows
foreach ( $ sheet -> nextRow () as $ rowNum => $ rowData ) {
// handle $rowData
}
// Skip empty cells and cells with empty strings
foreach ( $ sheet -> nextRow ([], Excel:: TREAT_EMPTY_STRING_AS_EMPTY_CELL ) as $ rowNum => $ rowData ) {
// handle $rowData
}
// Skip empty cells and empty rows (rows containing only whitespace characters are also considered empty)
foreach ( $ sheet -> nextRow ([], Excel:: TRIM_STRINGS | Excel:: TREAT_EMPTY_STRING_AS_EMPTY_CELL ) as $ rowNum => $ rowData ) {
// handle $rowData
}
다른 방법
$ sheet -> reset ([], Excel:: TRIM_STRINGS | Excel:: TREAT_EMPTY_STRING_AS_EMPTY_CELL );
$ rowData = $ sheet -> readNextRow ();
// do something
$ rowData = $ sheet -> readNextRow ();
// handle next row
// ...
use avadim FastExcelReader Excel ;
$ file = __DIR__ . ' /files/demo-02-advanced.xlsx ' ;
$ excel = Excel:: open ( $ file );
$ result = [
' sheets ' => $ excel -> getSheetNames () // get all sheet names
];
$ result [ ' #1 ' ] = $ excel
// select sheet by name
-> selectSheet ( ' Demo1 ' )
// select area with data where the first row contains column keys
-> setReadArea ( ' B4:D11 ' , true )
// set date format
-> setDateFormat ( ' Y-m-d ' )
// set key for column 'C' to 'Birthday'
-> readRows ([ ' C ' => ' Birthday ' ]);
// read other arrays with custom column keys
// and in this case we define range by columns only
$ columnKeys = [ ' B ' => ' year ' , ' C ' => ' value1 ' , ' D ' => ' value2 ' ];
$ result [ ' #2 ' ] = $ excel
-> selectSheet ( ' Demo2 ' , ' B:D ' )
-> readRows ( $ columnKeys );
$ result [ ' #3 ' ] = $ excel
-> setReadArea ( ' F5:H13 ' )
-> readRows ( $ columnKeys );
통합 문서에 정의된 이름으로 읽기 영역을 설정할 수 있습니다. 예를 들어 통합 문서에 Demo1!$B$4:$D$4 범위의 헤더라는 이름이 정의된 경우 이 이름으로 셀을 읽을 수 있습니다.
$ excel -> setReadArea ( ' Values ' );
$ cells = $ excel -> readCells ();
값에 시트 이름이 포함되어 있으므로 이 시트가 기본 시트가 됩니다.
시트에서 읽기 영역을 설정할 수 있습니다
$ sheet = $ excel -> getSheet ( ' Demo1 ' )-> setReadArea ( ' Headers ' );
$ cells = $ sheet -> readCells ();
하지만 이 이름을 다른 시트에 사용하려고 하면 오류가 발생합니다.
$ sheet = $ excel -> getSheet ( ' Demo2 ' )-> setReadArea ( ' Headers ' );
// Exception: Wrong address or range "Values"
필요한 경우 콜백 함수와 함께 readSheetCallback()
메서드를 사용하여 읽기 프로세스를 완전히 제어할 수 있습니다.
use avadim FastExcelReader Excel ;
$ excel = Excel:: open ( $ file );
$ result = [];
$ excel -> readCallback ( function ( $ row , $ col , $ val ) use (& $ result ) {
// Any manipulation here
$ result [ $ row ][ $ col ] = ( string ) $ val ;
// if the function returns true then data reading is interrupted
return false ;
});
var_dump ( $ result );
기본적으로 모든 날짜/시간 값은 타임스탬프로 반환됩니다. 그러나 dateFormatter()
사용하여 이 동작을 변경할 수 있습니다.
$ excel = Excel:: open ( $ file );
$ sheet = $ excel -> sheet ()-> setReadArea ( ' B5:D7 ' );
$ cells = $ sheet -> readCells ();
echo $ cells [ ' C5 ' ]; // -2205187200
// If argument TRUE is passed, then all dates will be formatted as specified in cell styles
// IMPORTANT! The datetime format depends on the locale
$ excel -> dateFormatter ( true );
$ cells = $ sheet -> readCells ();
echo $ cells [ ' C5 ' ]; // '14.02.1900'
// You can specify date format pattern
$ excel -> dateFormatter ( ' Y-m-d ' );
$ cells = $ sheet -> readCells ();
echo $ cells [ ' C5 ' ]; // '1900-02-14'
// set date formatter function
$ excel -> dateFormatter ( fn ( $ value ) => gmdate ( ' m/d/Y ' , $ value ));
$ cells = $ sheet -> readCells ();
echo $ cells [ ' C5 ' ]; // '02/14/1900'
// returns DateTime instance
$ excel -> dateFormatter ( fn ( $ value ) => ( new DateTime ())-> setTimestamp ( $ value ));
$ cells = $ sheet -> readCells ();
echo get_class ( $ cells [ ' C5 ' ]); // 'DateTime'
// custom manipulations with datetime values
$ excel -> dateFormatter ( function ( $ value , $ format , $ styleIdx ) use ( $ excel ) {
// get Excel format of the cell, e.g. '[$-F400]h:mm:ss AM/PM'
$ excelFormat = $ excel -> getFormatPattern ( $ styleIdx );
// get format converted for use in php functions date(), gmdate(), etc
// for example the Excel pattern above would be converted to 'g:i:s A'
$ phpFormat = $ excel -> getDateFormatPattern ( $ styleIdx );
// and if you need you can get value of numFmtId for this cell
$ style = $ excel -> getCompleteStyleByIdx ( $ styleIdx , true );
$ numFmtId = $ style [ ' format-num-id ' ];
// do something and write to $result
$ result = gmdate ( $ phpFormat , $ value );
return $ result ;
});
경우에 따라 셀 형식이 날짜로 지정되었지만 날짜가 포함되지 않은 경우 라이브러리가 이 값을 잘못 해석할 수 있습니다. 이를 방지하려면 날짜 형식을 비활성화할 수 있습니다.
여기서 셀 B1에는 문자열 "3.2"가 포함되어 있고 셀 B2에는 날짜 2024-02-03이 포함되어 있지만 두 셀 모두 날짜 형식으로 설정되어 있습니다.
$ excel = Excel:: open ( $ file );
// default mode
$ cells = $ sheet -> readCells ();
echo $ cell [ ' B1 ' ]; // -2208798720 - the library tries to interpret the number 3.2 as a timestamp
echo $ cell [ ' B2 ' ]; // 1706918400 - timestamp of 2024-02-03
// date formatter is on
$ excel -> dateFormatter ( true );
$ cells = $ sheet -> readCells ();
echo $ cell [ ' B1 ' ]; // '03.01.1900'
echo $ cell [ ' B2 ' ]; // '3.2'
// date formatter is off
$ excel -> dateFormatter ( false );
$ cells = $ sheet -> readCells ();
echo $ cell [ ' B1 ' ]; // '3.2'
echo $ cell [ ' B2 ' ]; // 1706918400 - timestamp of 2024-02-03
// Returns count images on all sheets
$ excel -> countImages ();
// Returns count images on sheet
$ sheet -> countImages ();
// Returns image list of sheet
$ sheet -> getImageList ();
// Returns image list of specified row
$ sheet -> getImageListByRow ( $ rowNumber );
// Returns TRUE if the specified cell has an image
$ sheet -> hasImage ( $ cellAddress );
// Returns mime type of image in the specified cell (or NULL)
$ sheet -> getImageMimeType ( $ cellAddress );
// Returns inner name of image in the specified cell (or NULL)
$ sheet -> getImageName ( $ cellAddress );
// Returns an image from the cell as a blob (if exists) or NULL
$ sheet -> getImageBlob ( $ cellAddress );
// Writes an image from the cell to the specified filename
$ sheet -> saveImage ( $ cellAddress , $ fullFilenamePath );
// Writes an image from the cell to the specified directory
$ sheet -> saveImageTo ( $ cellAddress , $ fullDirectoryPath );
라이브러리는 셀 값의 유형을 결정하려고 시도하며 대부분의 경우 올바르게 수행됩니다. 따라서 숫자 또는 문자열 값을 얻습니다. 날짜 값은 기본적으로 타임스탬프로 반환됩니다. 그러나 날짜 형식을 설정하여 이 동작을 변경할 수 있습니다(date() php 함수에 대한 형식 지정 옵션 참조).
$ excel = Excel:: open ( $ file );
$ result = $ excel -> readCells ();
print_r ( $ result );
위의 예는 다음과 같이 출력됩니다.
Array
(
[B2] => -2205187200
[B3] => 6614697600
[B4] => -6845212800
)
$ excel = Excel:: open ( $ file );
$ excel -> setDateFormat ( ' Y-m-d ' );
$ result = $ excel -> readCells ();
print_r ( $ result );
위의 예는 다음과 같이 출력됩니다.
Array
(
[B2] => '1900-02-14'
[B3] => '2179-08-12'
[B4] => '1753-01-31'
)
일반적으로 읽기 함수는 셀 값만 반환하지만 스타일을 사용하여 값을 읽을 수 있습니다. 이 경우 각 셀에 대해 스칼라 값이 반환되지 않고 ['v' => scalar_value , 's' => style_array , 'f' => Formula ]와 같은 배열이 반환됩니다.
$ excel = Excel:: open ( $ file );
$ sheet = $ excel -> sheet ();
$ rows = $ sheet -> readRowsWithStyles ();
$ columns = $ sheet -> readColumnsWithStyles ();
$ cells = $ sheet -> readCellsWithStyles ();
$ cells = $ sheet -> readCellsWithStyles ();
또는 스타일만 읽을 수 있습니다(값 없음).
$ cells = $ sheet -> readCellStyles ();
/*
array (
'format' =>
array (
'format-num-id' => 0,
'format-pattern' => 'General',
),
'font' =>
array (
'font-size' => '10',
'font-name' => 'Arial',
'font-family' => '2',
'font-charset' => '1',
),
'fill' =>
array (
'fill-pattern' => 'solid',
'fill-color' => '#9FC63C',
),
'border' =>
array (
'border-left-style' => NULL,
'border-right-style' => NULL,
'border-top-style' => NULL,
'border-bottom-style' => NULL,
'border-diagonal-style' => NULL,
),
)
*/
$ cells = $ sheet -> readCellStyles ( true );
/*
array (
'format-num-id' => 0,
'format-pattern' => 'General',
'font-size' => '10',
'font-name' => 'Arial',
'font-family' => '2',
'font-charset' => '1',
'fill-pattern' => 'solid',
'fill-color' => '#9FC63C',
'border-left-style' => NULL,
'border-right-style' => NULL,
'border-top-style' => NULL,
'border-bottom-style' => NULL,
'border-diagonal-style' => NULL,
)
*/
그러나 대용량 파일에는 이러한 방법을 사용하지 않는 것이 좋습니다.
XLSX 파일의 모든 시트에는 일련의 데이터 유효성 검사 규칙이 포함될 수 있습니다. 이를 검색하려면 시트에서 getDataValidations
호출하면 됩니다.
$ excel = Excel:: open ( $ file );
$ sheet = $ excel -> sheet ();
$ validations = $ sheet -> getDataValidations ();
/*
[
[
'type' => 'list',
'sqref' => 'E2:E527',
'formula1' => '"Berlin,Cape Town,Mexico City,Moscow,Sydney,Tokyo"',
'formula2' => null,
], [
'type' => 'decimal',
'sqref' => 'G2:G527',
'formula1' => '0.0',
'formula2' => '999999.0',
],
]
*/
시트의 특정 열 너비를 검색합니다.
$ excel = Excel:: open ( $ file );
$ sheet = $ excel -> selectSheet ( ' SheetName ' );
// Get the width of column 1 (column 'A')
$ columnWidth = $ sheet -> getColumnWidth ( 1 );
echo $ columnWidth ; // Example: 11.85
시트에서 특정 행의 높이를 검색합니다.
$ excel = Excel:: open ( $ file );
$ sheet = $ excel -> selectSheet ( ' SheetName ' );
// Get the height of row 1
$ rowHeight = $ sheet -> getRowHeight ( 1 );
echo $ rowHeight ; // Example: 15
시트의 고정 창 정보를 검색합니다.
$ excel = Excel:: open ( $ file );
$ sheet = $ excel -> selectSheet ( ' SheetName ' );
// Get the freeze pane configuration
$ freezePaneConfig = $ sheet -> getFreezePaneInfo ();
print_r ( $ freezePaneConfig );
/*
Example Output:
Array
(
[xSplit] => 0
[ySplit] => 1
[topLeftCell] => 'A2'
)
*/
시트의 탭 색상 정보를 검색합니다.
Copy code
$ excel = Excel:: open ( $ file );
$ sheet = $ excel -> selectSheet ( ' SheetName ' );
// Get the tab color configuration
$ tabColorConfig = $ sheet -> getTabColorInfo ();
print_r ( $ tabColorConfig );
/*
Example Output:
Array
(
[theme] => '2'
[tint] => '-0.499984740745262'
)
*/
다음 방법을 사용할 수 있습니다.
Sheet::getMergedCells()
- 병합된 모든 범위를 반환합니다.Sheet::isMerged(string $cellAddress)
-- 셀이 병합되었는지 확인합니다.Sheet::mergedRange(string $cellAddress)
-- 지정된 셀의 병합 범위를 반환합니다.예를 들어
if ( $ sheet -> isMerged ( ' B3 ' )) {
$ range = $ sheet -> mergedRange ( ' B3 ' );
}
getSheetNames()
- 모든 시트의 이름 배열을 반환합니다.sheet(?string $name = null)
-- 기본 또는 지정된 시트를 반환합니다.getSheet(string $name, ?string $areaRange = null, ?bool $firstRowKeys = false)
-- 이름으로 시트 가져오기getSheetById(int $sheetId, ?string $areaRange = null, ?bool $firstRowKeys = false)
-- ID로 시트 가져오기getFirstSheet(?string $areaRange = null, ?bool $firstRowKeys = false)
-- 첫 번째 시트를 가져옵니다.selectSheet(string $name, ?string $areaRange = null, ?bool $firstRowKeys = false)
-- 이름으로 기본 시트를 선택하고 반환합니다.selectSheetById(int $sheetId, ?string $areaRange = null, ?bool $firstRowKeys = false)
-- ID로 기본 시트를 선택하고 이를 반환합니다.selectFirstSheet(?string $areaRange = null, ?bool $firstRowKeys = false)
-- 첫 번째 시트를 기본값으로 선택하고 반환합니다.getDefinedNames()
- 통합 문서의 정의된 이름을 반환합니다.name()
-- 문자열의 이름을 반환합니다.isActive()
-- 활성 워크시트isHidden()
-- 워크시트가 숨겨진 경우isVisible()
- 워크시트가 표시되는 경우state()
- 워크시트의 문자열 상태를 반환합니다( isHidden()
및 isVisible()
에서 사용됨)dimension()
- 시트 속성에서 기본 작업 영역의 크기를 반환합니다.countRows()
-- 차원의 행 개수 계산countColumns()
-- 차원의 열 개수 계산firstRow()
-- 첫 번째 행 번호firstCol()
-- 첫 번째 열 문자readFirstRow()
-- 첫 번째 행의 셀 값을 배열로 반환합니다.readFirstRowWithStyles()
-- 첫 번째 행의 셀 값과 스타일을 배열로 반환합니다.getColumnWidth(int)
-- 주어진 열 번호의 너비를 반환합니다.getFreezePaneConfig()
- 고정 창 구성이 포함된 배열을 반환합니다.getTabColorConfiguration()
-- 탭 색상 구성이 포함된 배열을 반환합니다. 이 패키지가 유용하다고 생각되면 GitHub에서 별점을 주세요.
아니면 저에게 기부하셔도 됩니다 :)